摘要:在如今网络信息爆炸的背景下,如何帮助用户处理与分析网络文本信息并快速获取知识愈发显得重要。本文对于中英文文本关键词提取、文本自动摘要以及文本分类等关键技术进行了深入分析,并基于对特定领域主题的网络文本信息的处理,介绍了科技情报文献处理系统的设计与开发过程,最后给出了相应的测试结果并对其加以分析。64304
关键词 文本信息处理 特定主题 关键词提取 自动摘要 文本自动分类
毕业论文 外 文 摘 要
Title Specific subject areas of text information processing systems design and development
Abstract Under the background of network information explosion,it is increasingly important to help the user to process and analyze network text information and acquire knowledge in rapidly. Based on the network text information processing of specific topics, this article describe the key techniques of Chinese and English text keywords extraction, automatic text summarization, and text classification. At the same time, it introduces the process of design and development about a Science and Technology Intelligence Document Processing System . Finally, this paper presents the analysis of the experiment result.
Keywords Text information processing Specific topics
Keywords extraction Automatic Abstract Text automatic classification
1 引言 1
1.1研究背景及意义 1
2 系统分析与设计 2
2.1系统需求分析 2
2.2系统总体设计 2
2.2.1系统总体结构设计 2
2.2.2系统总体功能设计 2
3 英文文本信息处理 4
3.1英文文本信息处理流程 4
3.2交互界面的实施 4
3.3英文文本关键词提取 5
3.3.1英文文本信息预处理 6
3.3.2 基于词典的最大匹配算法 9
3.3.3 TF-IDF算法 10
3.4英文文本自动摘要 13
3.4.1基于特征分析的自动摘要算法 13
3.4.2 算法测试 16
4 中文文本信息处理 19
4.1中文文本信息处理流程 19
4.2交互界面的实施 19
4.2.1多文档多维处理 19
4.2.2单文档多维处理 20
4.3中文文本关键词与摘要自动生成 21
4.3.1文档关键词提取 21
4.3.2自动文本摘要 22
4.4中文文本自动分类 23
5 系统管理 25
5.1参数设置 25
5.2词典管理 26
结 论 27
致 谢 28
参考文献 29
1 引言
1.1研究背景及意义