U7知识总结(1).pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 4.61 MB
约6页
2024-05-16
收藏
评论
点赞(0)
海报
举报

课程知识总结Courseknowledgesummary第7节（语⾳识别，声⾳⽂字转换器）L1语⾳识别语⾳识别技术：将语⾳中的信息转换为计算机可以听懂的内容。⽣活中的应⽤：和机器⼈🤖说话、语⾳转⽂字等。例如：录制⾳频功能语⾳模块：ybc_speech录制⾳频功能：record参数1：⽣成⾳频的⽂件名（字符串）参数2：录制⾳频的时间（数字）返回值：⾳频⽂件名（字符串）importybc_speechv=ybc_speech.record('1.mp3',6)print(v)声⾳转⽂字功能语⾳模块：ybc_speech声⾳转⽂字功能：voice2text参数：需要识别的⾳频⽂件名（字符串）返回值：⽂本内容（字符串）例如：importybc_speecht=ybc_speech.voice2text('rao1.mp3')print(t)给模块取⼩名asimport模块名as⼩名例如：importybc_boxasbox扩展：语⾳识别技术语⾳识别，就是⼀种能让机器能够听⼈说的话的技术，简单来看可以分为：听声⾳、理解声⾳两个步骤。听声⾳理解步骤⼀：听声⾳将⼈的声⾳录制并存储成起来，在电脑中，储存的声⾳就像下⾯凹凸不平的波⼀样。⽣活中有很多不同的波，⽐如⽔⾯的“⽔波”，地震时产⽣的“地震波”等等。步骤⼆：理解声⾳计算机会对储存的声⾳进⾏处理，将它按照帧(⽐1秒还⼩很多的单位)拆分，然后对拆分出的声⾳信息进⾏处理，最后会得到⾳素，⾳素就是最⼩的语⾳单位，在汉语中，⾳素就是拼⾳中的⾳节，⽐如：nihao(你好)中的n，i，h，a，o，它们就被称为⾳素。⾳素kuaile(快乐)kuaile更多亲子好课加微信36903863扩展：语⾳识别技术然后计算机就会把⾳素重新组合成对应的拼⾳，这样就能知道语⾳⽂件中的信息了。回答naonihao声⾳⾳素拼⾳漫画⼀刻好你录制中处理中壮猿说的是你好nihao

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容