小型微型计算机系统JournalofChineseComputerSystemsDOI:10.20009/j.cnki.21⁃1106/TP.2022⁃04802023年3月第3期Vol.44No.32023收稿日期:2022⁃08⁃17收修改稿日期:2022⁃09⁃13基金项目:国家重点研发计划项目(2021ZD0112400,2020AAA0106100)资助;国家自然科学基金重点项目(62136005)资助;山西省重点研发计划项目(201903D421003)资助;山西省高等学校科技创新项目(2019L0034)资助;山西省青年科学基金项目(20210302124556)资助.作者简介:张霞,女,1977年生,博士,副教授,CCF会员,研究方向为机器学习和图像处理;刘乾,男,1997年生,硕士研究生,研究方向为声纹识别和深度学习;郭倩,女,1990年生,博士,CCF会员,研究方向为逻辑学习、抽象推理及它们在多图检索上的应用;梁新彦,男,1989年生,博士,讲师,CCF会员,研究方向为多视图机器学习和粒计算;钱宇华,男,1976年生,博士,教授,博士生导师,CCF会员,研究方向为人工智能、大数据、机器学习和数据挖掘;畅江,女,1988年生,博士,讲师,研究方向为语音信号处理、脑电信号分析、声纹识别和情感识别.强调信息传播和特征分布的说话人验证模型:EIPFD⁃ResNet张霞1,2,3,刘乾1,2,3,郭倩1,2,梁新彦1,2,钱宇华1,2,畅江1,21(山西大学大数据科学与产业研究院,太原030006)2(山西省机器视觉与数据挖掘工程研究中心,太原030006)3(山西大学计算机与信息技术学院,太原030006)E⁃mail:stitch0507@163.com摘要:说话人验证是一种自然、有效的生物特征身份认证方法,其性能很大程度上取决于所提取说话人特征的质量.残差网络(ResNet)具有优越的推理能力,可以提取高质量的说话人特征,因此广泛地应用于说话人验证任务中,然而目前残差网络仍存在音频数据信息利用不充分,提取的特征不利于分类说话人等问题,这些问题大大限制了残差网络的表征能力.本文聚焦于残差网络的模型结构,详细分析了残差块分布比例、激活层、跳跃连接这些结构因素对特征信息提取的影响,以及模型输出特征分布对说话人分类结果的影响,并据此对原始残差块、特征下采...