西北大学学报(自然科学版)2023年6月,第53卷第3期,Jun.,2023,Vol.53,No.3JournalofNorthwestUniversity(NaturalScienceEdition)■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■收稿日期:2022⁃11⁃15基金项目:陕西省自然科学基础研究计划面上项目(2022JM⁃324);陕西省社会科学基金项目(2021K014)第一作者:韩泓丞,男,江西抚州人,博士研究生,从事机器学习和医学图像分析研究。通信作者:林玉萍,女,黑龙江勃利人,教授,从事语料库和二语习得研究,linyouchen@xjtu.edu.cn;岳婕,女,陕西西安人,从事医学图像处理研究,jennie-yue@xjtu.edu.cn。·医疗与人工智能·面向多模态医学语料库的皮肤镜图像分类韩泓丞1,林玉萍2,郭钦钵1,张栋1,3,许美凤4,朱龙飞4,李小棉2,冯丽丽5,岳婕6(1.西安交通大学人工智能学院,陕西西安710049;2.西安交通大学外国语学院,陕西西安710049;3.西安交通大学自动化科学与工程学院,陕西西安710049;4.西安交通大学第二附属医院皮肤科,陕西西安7100049;5.韩国全北国立大学英语教育学系,韩国全北全州560759;6.西安交通大学第一附属医院儿科,陕西西安710061)摘要多模态医学语料库是医学研究、临床诊断和教学的重要工具之一。然而,现有的医学语料库大多仅有文本数据,缺乏匹配的直观图像,信息不够充分。而大量医学图像缺少明确的语义标签,导致构建语料库困难。针对上述问题,该文提出一种面向多模态医学语料库的皮肤镜图像分类方法,通过对皮肤镜图像进行精确分类获取语义标签,并结合自然语言处理方法匹配相关文本信息,从而建立图像与文本相结合的多模态语料库。首先,针对传统机器学习图像分类方法对病灶特征提取较弱且易受背景噪声影响,导致病灶分类精度差的问题,该文构建双流网络,通过融合病灶的形状与纹理特征增强病灶特征提取能力。其次,为减少特征融合导致的信息冗余,引入了基于通道注意力机制的特征筛选方法,关注关键特征并抑制噪声影响。此外,针对皮肤镜图像良恶性样本数量不均衡导致的模型优化困难问题,引入非对称损失函数,提升模型对样本不均衡的鲁棒性。在ISIC皮肤镜图像数据集上的实验结果表明...