【基於松弛方法的信址疑难语段确认原理及其实现】.pdf

摘要 为了提高汉宇的识别率,本文提出了一种在单个汉宇的初级识别后,综合利用 上下文关系和松弛算法,对汉字不确认语段作进一步确认的方法,具体讨论了联宇 库及地名语义网的建立及其库结构设计和实现此方法的理论算法,并给出了一个针 对信址疑难语段确认的实际系统。
杭州大学研究生论文 目录 第一章综述 1引言 1汉字识别技术简介 1汉字识别的认知心理 1本文确论方法简介及章节安排 第二章信址词联分析 2词联一般规律 2字及词联统计 2词联库的构成及生成 第三章地名语义信息网 3地名语义信息网的结构描述 3地名语义信息网关系 3地名语义信息网的数据库实现 第四章信址疑难语段确认 4信址疑难语段描述及信址语段的约束关系 4信址疑难语段确认算法介绍 4确认信址疑难语段的松弛算法的实现方法 4可信度初值的选择 4确认模块总体简介 4字切分处理 4.
第一章综述 汉宇信息处理系统中手动输入效率低这个关键间题。随着计算机技术的发展。汉宇 信息处理亲统的处理和输出汉宇的高速度和用手工操作的低速汉宇输入产生极大的 矛盾,而且这一矛盾有越来越大的超势,从而使得汉字输入成了解决整个采统效率 的”瓶颈”。这一点从下面的一组数字中就能很清楚地反映出来:输出:如打印机输出汉宇:LQ1600K中英文点陈打印机:100宇/秒(革稿方式).或50字/秒(信函方式)HPLascr.Jct4L激光打印机:每分钟4页A4纸,约120字/秒.HPDcskJct中文喷墨打印机:110字/秒(印刷质量方式).或160宇/秒(革稿质量方式)。 