课程知识总结Courseknowledgesummary第7节(语⾳识别,声⾳⽂字转换器)L1语⾳识别语⾳识别技术:将语⾳中的信息转换为计算机可以听懂的内容。⽣活中的应⽤:和机器⼈🤖说话、语⾳转⽂字等。例如:录制⾳频功能语⾳模块:ybc_speech录制⾳频功能:record参数1:⽣成⾳频的⽂件名(字符串)参数2:录制⾳频的时间(数字)返回值:⾳频⽂件名(字符串)importybc_speechv=ybc_speech.record('1.mp3',6)print(v)声⾳转⽂字功能语⾳模块:ybc_speech声⾳转⽂字功能:voice2text参数:需要识别的⾳频⽂件名(字符串)返回值:⽂本内容(字符串)例如:importybc_speecht=ybc_speech.voice2text('rao1.mp3')print(t)给模块取⼩名asimport模块名as⼩名例如:importybc_boxasbox扩展:语⾳识别技术语⾳识别,就是⼀种能让机器能够听⼈说的话的技术,简单来看可以分为:听声⾳、理解声⾳两个步骤。听声⾳理解步骤⼀:听声⾳将⼈的声⾳录制并存储成起来,在电脑中,储存的声⾳就像下⾯凹凸不平的波⼀样。⽣活中有很多不同的波,⽐如⽔⾯的“⽔波”,地震时产⽣的“地震波”等等。步骤⼆:理解声⾳计算机会对储存的声⾳进⾏处理,将它按照帧(⽐1秒还⼩很多的单位)拆分,然后对拆分出的声⾳信息进⾏处理,最后会得到⾳素,⾳素就是最⼩的语⾳单位,在汉语中,⾳素就是拼⾳中的⾳节,⽐如:nihao(你好)中的n,i,h,a,o,它们就被称为⾳素。⾳素kuaile(快乐)kuaile更多亲子好课加微信36903863扩展:语⾳识别技术然后计算机就会把⾳素重新组合成对应的拼⾳,这样就能知道语⾳⽂件中的信息了。回答naonihao声⾳⾳素拼⾳漫画⼀刻好你录制中处理中壮猿说的是你好nihao