摘要互联网信息海纳百川,纷繁复杂,随着互联网规模的不断扩大,内容的不断革新,信息采集技术也在随之不断发展。根据不同的实现方式和手段,信息采集技术也有许多不同的种类。信息采集技术的核心在于,采集信息的过程和对采集信息的处理与分析。不同格式信息的处理与分析也是信息采集技术要考虑的问题之一。本次实践活动的主要方法是利用开发程序的过程,来实现对互联网信息采集过程的探索与实践。主要成果是实现一款多路采集,并能将信息简单处理入库的软件。21412
关键词 信息采集 源码获取 数据截取 数据入库 毕业论文设计说明书(论文)外文摘要
Title Reliable Network Traffic Collection for Network Characterization and User Behavior
Abstract
This paper presents a reliable and complete traffic collection facility as a first and crucial step toward accurate traffic analysis for network characterization and user behavior.The key contribution is to produce an accurate, reliable and high fidelity traffic traces as the valuable source of information in the passive traffic analysis approach. In order to guarantee the traces reliability, we first detect the bottlenecks of the collection facility, and then propose different monitoring probes starting
from the ethernet network interface and ending at the packet trace. The proposed facility can run without stop for long time instead of one-shot periods, therefore, it can be used to draw a complete picture of network traffic that fully characterize the network and user behavior. The laboratory experiments conclude that the system is highly reliable, stable and produces reliable traces attached with different statistics reports that come from the installed monitoring probes.
Keywords information collection reliable system characterize behavior analysis data
目 次
1 引言 1
1.1 开发背景 1
1.2 课题目标 1
1.3 研究背景 1
1.4 国内外研究现状 2
1.4.1 网络信息的特点 2
1.4.2 网络信息采集 2
1.4.3 网络信息采集技术方法 2
1.4.4 本次毕业设计选用的技术 3
1.4.5 存在的问题 3
1.5 研究方法 4
1.5.1 可以预见的问题 4
1.5.2 解决问题的研究手段 4
1.5.3设计过程 5
2 总体设计 6
2.1 制定计划 6
2.2 各个模块的描述 7
2.2.1 数据库模块 7
2.2.2 用户设置模块 7
2.2.3 信息采集模块 7
2.2.4 信息管理模块 7
2.2.5 信息统计模块 7
2.2.6 信息显示模块 7
2.2.7 更新模块 8
3 详细设计 9
3.1 程序概述 9
3.2 程序组织结构设计 10
3.2.1 URL检测 10
3.2.2 开始界面 10
3.2.3 选择界面 10
3.2.4 帮助界面 11
3.2.5 拓展界面 11
3.2.6 选择界面2 11
3.2.7 主界面 12
3.2.8 管理界面 12