文章编号:0427-7104(2023)01-0037-09收稿日期:2022-03-08基金项目:国家自然科学基金青年科学基金(12004275);山西省应用基础研究计划面上自然基金(201901D111095,201901D111096,20210302123186);山西省留学回国人员科技活动择优资助项目(20200017);太原理工大学引进人才科研启动基金(tyut-rc201405b)作者简介:李海烽(1995—),男,硕士研究生;张雪英,女,教授,通信作者,E-mail:tyzhangxy@163.com;段淑斐,女,副教授,并列通信作者,E-mail:duanshufei@tyut.edu.cn基于DKU-JNU-EMA数据库发音特征的方言识别李海烽,张雪英,段淑斐,贾海蓉,李良琦(太原理工大学信息与计算机学院,山西太原030024)摘要:为研究广东话、客家话、潮州话和普通话的发音差异性,提出了一种基于发音特征的方言识别系统。本研究采用DKU-JNU-EMA数据库,以广东话、客家话、潮州话和普通话为研究对象,通过端点检测法实现对数据集的预处理,提取了数据集中发音器官的位移、速度和加速度参数,并对发音运动器官进行了空间和速度的统计学分析,然后选用随机森林和支持向量机分类器对所取的提特征集进行识别分类。实验结果表明,本文提取的发音特征在机器学习分类器的识别分类中是有效的,选用支持向量机做分类器时,在齿龈位置的分类平均准确率达到83.1%。关键词:汉语方言;DKU-JNU-EMA数据库;发音特征;语音识别中图分类号:H215;TP18文献标志码:A方言识别是语音研究领域的一个重要分支,是通过对说话人的声学和发音学数据分析来判断说话人语种的技术。在对方言识别的研究上,需要采集语音的声学数据和发音数据作为研究的数据来源。目前主流的声学和发音学数据采集技术是使用电磁发音仪(ElectromagneticArticulography,EMA)来完成,Ji等[1]使用北方数字公司(NorthernDigitalInc,NDI)的Wave语音动作跟踪系统以400Hz的采样速率采集了40名说话者的并行的发音学和声学的EMA数据。冯小欢等[2]利用EMA收集了6名构音障碍患者和10名同龄健康人的发音器官的运动轨迹参数。目前对语音识别的研究中,学者们大多都是基于声学数据进...