摘要:在这个信息发展飞速的时代,互联网成为人们生活中密不可分的一部分,然而网络上信息的泛滥,如何采集和过滤一些有用的信息对于人们而言就变得十分重要。新闻信息采集系统就是将非结构化的新闻信息从多个新闻来源网页中抽取出来保存到结构化的数据库中的过程。40341
本系统运行于Apache Tomcat-7.0.40平台,采用J2EE架构、Java语言、MyEclipse开发工具、Struts 2技术以及MySQL数据库开发而成。该系统前台主要实现用户管理、主题设置、采集设置、信息应用等功能,后台主要实现数据采集功能和系统整合功能。
该系统的实现解决了网络编辑工作人员的大量工作,方便大型网站更新数据,为企业减少劳动力、节约劳动成本,而且用户操作起来简单、易学。
毕业论文关键词: 新闻采集;信息抓取;Java;MySQL数据库 
 Design and Implementation of Information Collection System
Abstract:
In this era of rapid development of information, the Internet has become inseparable part of people's lives, but the proliferation of information on the network, how to collect and filter useful information for people concerned becomes very important. News and information gathering systems is unstructured news and information extracted from multiple news sources out pages are saved to the database in a structured process.
The system runs on Apache Tomcat-7.0.40 platform with J2EE architecture, Java language, MyEclipse development tools, Struts 2 technology and MySQL database was developed. The user management system is the main reception, theme settings, capture settings, information applications and other functions, the main achievement of the background data acquisition and system integration.
Implementation of the system to solve a lot of work network editorial staff, to facilitate large sites to update data, for companies to reduce labor, save labor costs, and the user operation is simple, easy to learn.
Keywords: News Gathering;Information Extraction;Java;MySQL
 目  录
第1章  绪论    1
1.1 课题背景    1
1.2 课题的目的及意义    1
1.2.1 课题的目的    1
1.2.1 课题的意义    1
1.3 国内研究概况及发展趋势    1
1.4 本文研究内容及主要贡献    2
第2章  需求分析    3
2.1 可行性研究    3
2.1.1 经济可行性    3
2.1.2 技术可行性    3
2.1.3 硬件设施可行性    3
2.2 功能需求分析    3
2.3 开发技术简介    3
2.3.1 JSP技术    3
2.3.2 JavaBean    4
2.3.2 JDBC    4
     2.3.2 Struts2    4
  2.4 运行环境    4
2.4.1 服务器环境    4
2.4.2 用户端环境    4
第3章 系统设计    5
3.1 总体设计思路    5
3.1.1  层次结构图    5
3.1.1  系统流程图    6
3.2 数据库设计    7
3.2.1  用户User    7
3.2.2  主题Theme    8
3.2.1  新闻News    9
3.2.2  收藏Favorite    10
3.2.1  逻辑关系E-R图    10
3.3 功能模块设计    11
3.3.1  用户管理    11
3.3.2  信息浏览    12
3.3.3  主题设置    12
3.3.4 采集设置    13
3.3.5  信息应用    14
上一篇:jsp+sqlserver在线考试系统的设计与实现
下一篇:园区网统一安全认证计费管理方案的设计与实施

银行行办公信息服务系统【1544字】

论信息技术茬外语教學中的應用【3270字】

计算机信息管理茬第三方...

电子商务中信息不對称问题研究【2365字】

用友NC信息系统的实施應用实践研究【3307字】

嵌入式系统数字图像采集...

网络信息安全技术管理的...

公寓空调设计任务书

国内外图像分割技术研究现状

AT89C52单片机的超声波测距...

中国学术生态细节考察《...

志愿者活动的调查问卷表

医院财务风险因素分析及管理措施【2367字】

神经外科重症监护病房患...

承德市事业单位档案管理...

C#学校科研管理系统的设计

10万元能开儿童乐园吗,我...