【一种基於语境信息利用的汉语自动分词方法】.pdf

一种基于语境信息利用的汉语自动分词方法摘要汉语分词是汉语言处理有别于拼音文字语言处理的特点之一,也是汉语言的计算机处理中的瓶颈问题。本文针对词切分中的歧义问题,提出了一种基于语境信息利用的自动分词方法,并在实验中取得了良好的效果,衡量一种分词方法好坏的标准有两个:一个是速度,另一个是精度。我们为了提高分词速度,将分词词典设计成词首字索引式并利用了扩充内存管理(EMS)技术.为了提高分词精度,在消歧的算法上打破了传统的先机械分词,再根据规则库对分词结果进行校正的做法,而是先保留各种分词结果的可能性,再利用周围信息的语法约束条件对不确定语段进行松弛选代以确定最合理的切分．本系统在

目录摘要 Abstract 第一章绪论1计算语言学及其研究内容1 语言学及其研究概况。1 语境研究概况.1 形式语法、语义和语用研究。1 语言理解的心理模型与知识表示 1 汉语的计算机理解书面汉语自动分词方法 1 问题的提出1 自动分词方法与技术。1存在的问题 1本文工作第二章基本知识介绍2自动分词定义 2定义 2 一个自动分词模型2歧义字段的分析第三章总体设计思想和系统结构3.

杭州大学硕士论文1997 第一章绪论 1计算语言学及其研究内容计算语言学作为人工智能的一个分支,是研究如何利用计算来理解和生成自然语言的.一般我们把人工设计的编程语言象BASIC语言,FORTRAN语言,ADA 语言等等语言称为人工语言,而自然语言就是我们日常使用的语言,如英语、汉语、法语等。对这些语言的计算化处理就构成了计算语言学的主要研究内容.计算语言学,按照RalphGrishman的定义,相当于自然语言理解,不过从某种意义上讲,前者侧重一点理论,后者主要侧重应用,计算语言学是一门自然科学和社会科学交叉的学科,特别是计算机科学、数学、语言学、心理学、和哲学相互