2022年第46卷第10期84器件与应用artsandApplicationsP文献引用格式:郭慧娴.基于无标签数据的音源分离[J].电声技术,2022,46(10):84-86.GUOHX.Soundsourceseparationbasedonunlabeleddata[J].AudioEngineering,2022,46(10):84-86.中图分类号:TP311.1文献标识码:ADOI:10.16311/j.audioe.2022.10.024基于无标签数据的音源分离郭慧娴(北京师范大学信息科学与技术学院,北京100875)摘要:音源分离目前大多采用有监督的深度学习方法,这种方法往往需要利用大量的标签数据进行建模。然而,实际中标签数据并不容易获取且价格昂贵。针对无标签数据的音源分离只能采用有意义的先验知识来弥补标签数据的不足,对此,提出一种基于先验知识的U-Net模型。它既不影响现有卷积体系结构的网络复杂性,也不影响其收敛行为,但能显著改善分离后的音频质量。实验结果表明,所提出的方法的分离效果比传统模型更好。关键字:音源分离;无标签数据;U-Net模型SoundSourceSeparationBasedonUnlabeledDataGUOHuixian(CollageofInformationScienceandTechnology,BeijingNormalUniversity,Beijing100875,China)Abstract:Atpresent,superviseddeeplearningmethodismostlyusedinsoundsourceseparation,whichoftenneedstousealargenumberoflabeldataformodeling.However,inpractice,labeldataisnoteasytoobtainandexpensive.Forthesoundsourceseparationofunlabeleddata,wecanonlyusemeaningfulaprioritomakeupforthedeficiencyoflabeleddata.Therefore,thispaperproposesau-netmodelbasedonaprioriknowledge,whichdoesnotaffectthenetworkcomplexityoftheexistingconvolutionarchitectureoritsconvergencebehavior,butitcansignificantlyimprovetheaudioqualityafterseparation.Theexperimentalresultsshowthattheseparationeffectoftheproposedmethodisbetterthanthetraditionalmodel.Keywords:soundsourceseparation;unlabeleddata;U-Netmodel0引言音源分离是指从混合音源中恢复干净声源。近年来,利用有监督的深度学习从单通道混合音源中提取干净声源的方法取得了重大进展。有监督音源分离模型使用混合信号波形作为输入,干净的音源波形作为参考信号,估计音源波形作为输出,然后训练分离模型。深度卷积神经网络已被证明可以有效地从混合音频中分离出干净的声源,如深度聚类[1-2]、置换不变训练[3-4]以及深度吸引器网络等[5-6]。最近,有人提出了无...