【一种基於语境信息利用的汉语自动分词方法】.pdf

一种基于语境信息利用的汉语自动分词方法 摘要 汉语分词是汉语言处理有别于拼音文字语言处理的特点之一,也是汉语言 的计算机处理中的瓶颈问题。本文针对词切分中的歧义问题,提出了一种基于 语境信息利用的自动分词方法,并在实验中取得了良好的效果,衡量一种分词 方法好坏的标准有两个:一个是速度,另一个是精度。我们为了提高分词速度,将分词词典设计成词首字索引式并利用了扩充内存管理(EMS)技术.为了提 高分词精度,在消歧的算法上打破了传统的先机械分词,再根据规则库对分词 结果进行校正的做法,而是先保留各种分词结果的可能性,再利用周围信息的 语法约束条件对不确定语段进行松弛选代以确定最合理的切分.本系统在
目录 摘 要 Abstract 第一章 绪论1计算语言学及其研究内容1 语言学及其研究概况。1 语境研究概况.1 形式语法、语义和语用研究。1 语言理解的心理模型与知识表示 1 汉语的计算机理解书面汉语自动分词方法 1 问题的提出1 自动分词方法与技术。1存在的问题 1本文工作第二章 基本知识介绍2自动分词定义 2定义 2 一个自动分词模型2歧义字段的分析 第三章 总体设计思想和系统结构3.
杭州大学硕士论文1997 第一章绪论 1计算语言学及其研究内容 计算语言学作为人工智能的一个分支,是研究如何利用计算来理解和生成自 然语言的.一般我们把人工设计的编程语言象BASIC语言,FORTRAN语言,ADA 语言等等语言称为人工语言,而自然语言就是我们日常使用的语言,如英语、汉语、法语等。对这些语言的计算化处理就构成了计算语言学的主要研究内容.计算语言学,按照RalphGrishman的定义,相当于自然语言理解,不过从某种意 义上讲,前者侧重一点理论,后者主要侧重应用,计算语言学是一门自然科学和 社会科学交叉的学科,特别是计算机科学、数学、语言学、心理学、和哲学相互 