【汉语普通话不认人语音识别系统研究】林少丹.pdf

摘要 实现汉语普通话连续语音识别系统,首先必须实现“无限集”汉字孤立字的识别。本文介绍了一种基于音素的汉语普通话“不 认人”语音识别系统,该系统建立在IBM一PC/XT机上,并采用TMS32010快速处理芯片作为辅助处理器。音节检 测采用硬件电路实现。数模转换器A/D的输出数据以DMA方 式传送给IBM一PC/XT机。根据元音的发音系统可以用一 组谐振(共振峰)来表示,系统目前采用了同态滤波一一倒频谱 的方法提取语音共振蜂特征,实现音素和音调识别,并初步对6 个带音调单韵母a、0、e、1、u、u作了8个人50人次的 识别,结果统计表明识别率达到884 以上,实现了预期目 的,为达到识别结
第一章:前言 用计算机自动识别人类语音,以实现计算机的快速输入,是 许许多多科学工作者孜孜不倦努力寻求的目标.纵观语音识别发展的三十年历史,随着高速、大容量的计算 机的不断推出和应用,语音识别一直稳步向前发展,目前正处于 鼎盛时期,呈现出方兴未艾的势头,现在,孤立字单词识别系统(有限字符集)已发展得比较发熟,一个具有一百单词的字典的 不认人识别系统,识别率已经可以做到大于95 ,好的系统已 达到98 以上,而且可以做到准实时识别,因而己,具有一定的 实用价值,连续语音识别系统目前世界各国也已开展了很多工作,最近,在美国召开的86年工EEE国际信息论会议上,IB M公司推出了有2400个字
擦音的“不认人”识别率为70送气塞音识别率为786 ,不送气塞音识别率为56。研究工作目前正在不断进行 呈现很好的前景 在上述理论研究的基础上,开展了本论文的工作,即在IBM 一PC/XT机上开发汉语语音不认人识别系统。该系统采用 了美国Texas公司推出的NMOS大规模集成电路 TBS32010快速信号处理片芯,以达到准时目的。该系统 是在CCDOS汉字操作系统的支持下运行的,并改进了CCDOS 的拼音输入检索功能,即增加了语音音调作的检索参数,达 到使用汉字显示识别结果的目的。 