【一种面向汉语语音识别的口形形状识别方法及其实现】.pdf

一种面向汉语语音识别的口形 形状识别方法及其实现?摘要 本文借助于成熟的模式识别技术,分析了汉语发音口形的生理特点,在音素识别这一水平上,进行汉语语音音素的辅助识别,具体给出了一种口形形状识别和灰度的统计方法以及实现算法。实验结果与理论估算相 吻合,对五个元音的口形区别正确率在80 以上,这就为语言的声波识 别提供了一种较为有利的辅助手段.关键词:汉语语音识别口形特征提取口语看话统计模式识别①本课题是断江省自然科学基金项目,并得到北京大学视觉与听沉国家实验室的赞助。
目录 第一章绪论1 引言1口形识别基本原理和思想1 本文工作第二章 边缘检测2 边缘检测综述2 零交叉检测技术第三章 运动检测3运动检测综述3双目检测技术3模板窗口的匹配方法3 协同匹配技术第四章口形语音音素分析4语音学概述语音学介绍 语音口形研究成果4有关定义音素口形分析4.
第一章绪论 1引言 在人类语言交流中,特别是在环境噪声非常强的情况下,不仅使用声 学言语信号来理解语言,通常还利用其它信息源,如口语看话(lipreading),面部表情(facial-expression),手势(hand-gesture)和身体 语言(body-language)等来高精确地识别语言.对于有听力障碍的聋哑 人,口语看话更是一种高水平的语言交流手段。实际上,仅靠看口形,聋哑 人就可以理解一个句子的70 至80 的内容。可见,口形及其动态变化 在言语理解中的重要。 