【基於概念的WWW文本分类与识别的研究】赵一唯.pdf

2001年0月2日 论文答辩日期:指导教师:王和(签字)
基于概念的WWW文本分类与识别的研究 目 摘要.Abstract.第一章 绪论 1 Intemet现状与 Intermet信息特点 1 信息检索系统结构与分类1 检索技术.1 目前的信息发现方式,1 主动式搜索.1 基于Push技术的信息获取1 搜索引擎方式1 WWW搜索引擎设计.1 总体设计思想1 搜集代理模块1 收集控制模块1 文档发现模块.1.
基于概念的WWW文本分类与识别的研究 摘要 随着Intemet的迅速发展,WWW已经成为世界上最大的信息库,它 正日益改变着人类的生活方式。然而,由于信息资源庞大,结构复杂,如何高效的从中找到需要的信息,已经成为一个重要的问题.传统的文本分类和检索,均为基于关键字的方法,它存在很明显的 缺陷,当关键字与目标文档尽管语义相同,但用词不一致时,检索往往 失败,导致查准率和召回率都很低.众所周知,WWW信息检索系统的核心问题之一就是文本的分类与 识别。本文基于种种WWW文本检索分类,识别技术,提出了一种基于 概念的WWW文本分类,识别的方法。 