【手写体汉字的预处理及识别】刘丹.pdf

目录目录 鸣谢 中文摘要 英文摘要 第一章 汉字识别概述1 汉字识别的历史 1 汉字的字形 1 人的汉字识别 1 机器的汉字识别 1 机器识别的原理 1 统计决策法与结构分析法 第二章 预处理技术2 图像的分类和表示 2 彩色图像的灰度化 2 灰度图像的二值化 2 图像的平滑和滤波 2 文本图像的倾斜校正 2 行切分与字切分 2 字符的大小规范化 第三章 手写体汉字库3 字库的规划和收集 3 字库的结构和格式 3 预处理系统的设计 第四章 识别实验4 实验字符集的选择.
中文摘要 摘要 本文主要介绍了作者于硕士研究生阶段中在脱机手写体汉字识 别方面所做的工作,包括预处理系统的设计和手写体汉字库的建库 及对常用字符(数字、字母、标点等)的识别实验。首先作者在第一 章中回顾了手写体汉字识别的概况,包括手写体汉字识别的历史、意 义、原理。然后在第二章和第三章中介绍了预处理系统的设计和功能 及实验结果。这套预处理系统是作者使用面向对象设计的方法独立 开发的基于MicrosoftWindows3的软件系统,包括字库建库子系统和库 管理子系统。系统支持多种常用图像格式,具有灰度化、二值化、平 滑滤波、自动倾斜校正、行字自动切分、多种规一化、块操作、记录 编辑等功能。
第一章汉字识别概述 第一章汉字识别概述 人类社会已开始进人信息时代,信息产业的发展将极大地影响 国家和民族的的发展,因此世界各国都非常重视信息产业的建设.目前席卷全球的信息高速公路的热潮就是一个证明。文字是人类文 明延续和发展的载体。在信息化过程中,各种文字记录都面临着电 子化的迫切要求,以使实现计算机处理.文字识别是模式识别研究和人工智能中最富有挑战性的问题,欧美国家为了将浩如烟海、与日俱增的大量报纸杂志、文件资料和 单据报表等文学材料输入计算机进行处理,从50年代起就开始了西 文OCR(OpticalCharacterRecognition)的研究,以代替键盘输人。 