摘要:在如今网络信息爆炸的背景下,如何帮助用户处理与分析网络文本信息并快速获取知识愈发显得重要。本文对于中英文文本关键词提取、文本自动摘要以及文本分类等关键技术进行了深入分析,并基于对特定领域主题的网络文本信息的处理,介绍了科技情报文献处理系统的设计与开发过程,最后给出了相应的测试结果并对其加以分析。64304

关键词  文本信息处理 特定主题 关键词提取 自动摘要 文本自动分类 

毕业论文 外 文 摘 要

Title   Specific subject areas of text information processing systems design and development

Abstract Under the background of network information explosion,it is increasingly important to help the user to process and analyze network text information and acquire knowledge in rapidly. Based on the network text information processing of specific topics, this article describe the key techniques of Chinese and English text keywords extraction, automatic text summarization, and text classification. At the same time, it introduces the process of design and development about a Science and Technology Intelligence Document Processing System . Finally, this paper presents the analysis of the experiment result.

Keywords  Text information processing  Specific topics  

Keywords extraction  Automatic Abstract  Text automatic classification

1  引言 1

1.1研究背景及意义 1

1.2国内外研究现状 1

2 系统分析与设计 2

2.1系统需求分析 2

2.2系统总体设计 2

2.2.1系统总体结构设计 2

2.2.2系统总体功能设计 2

3 英文文本信息处理 4

3.1英文文本信息处理流程 4

3.2交互界面的实施 4

3.3英文文本关键词提取 5

3.3.1英文文本信息预处理 6

3.3.2 基于词典的最大匹配算法 9

3.3.3 TF-IDF算法 10

3.4英文文本自动摘要 13

3.4.1基于特征分析的自动摘要算法 13

3.4.2 算法测试 16

4 中文文本信息处理 19

4.1中文文本信息处理流程 19

4.2交互界面的实施 19

4.2.1多文档多维处理 19

4.2.2单文档多维处理 20

4.3中文文本关键词与摘要自动生成 21

4.3.1文档关键词提取 21

4.3.2自动文本摘要 22

4.4中文文本自动分类 23

5 系统管理 25

5.1参数设置 25

5.2词典管理 26

结  论 27

致  谢 28

参考文献 29

1  引言

1.1研究背景及意义

上一篇:群决策中分歧专家分歧指标的界定研究
下一篇:netlogo网民群体情感主观效用仿真研究

数据挖掘的主题标绘数据获取技术与实现

电子商务领域研究主题和趋势探讨【2826字】

面向中医诊断帕金森病领域多标签学习

NLP&CC201微博特定话题情感分析方法研究

云计算在电子商务领域中...

DSP基于无人机的特定视频目标检测算法研究

有向图的特定模式搜索和优化

麦秸秆还田和沼液灌溉对...

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识

老年2型糖尿病患者运动疗...

我国风险投资的发展现状问题及对策分析

网络语言“XX体”研究

安康汉江网讯

互联网教育”变革路径研究进展【7972字】

ASP.net+sqlserver企业设备管理系统设计与开发

新課改下小學语文洧效阅...