Weka基于特征组合的钓鱼网页检测系统设计
时间:2018-09-11 11:06 来源:毕业论文 作者:毕业论文 点击:次
摘要科技的进步促使了网络的大面积普及,人们生活中的衣食住行也与网络产生了密不可分的交集。不少商家瞄准网络中潜在的巨大商机,纷纷将交易平台向网络延伸,这也给网络安全文护带来了巨大的挑战。不法分子通过网络钓鱼进行网络犯罪的案件也已屡见不鲜,对人们的个人财产以及隐私信息都造成了极大的威胁。本文基于特征组合与Weka机器学习软件对钓鱼网站检测系统的开发进行研究,以钓鱼网页检测为主要研究对象,分别对课题研发背景,研发技术分析,设计框架及每部分工作原理以及测试结果进行了细致的阐述。28153 关键词 网络安全 网络钓鱼 特征组合 钓鱼网站检测系统 毕业论文设计说明书外文摘要 Title Phishing Website detection based on feature group Abstract Advanced scientific technology give rise to widespread of the Internet.People’s daily life have intimate connection with the Internet.Many merchants aim at the potential interest of the Internet and put their trading platform forward to the Internet,thus making maintaining the security of the Internet a huge challenge.It has been a common crime that Lawbreakers commit crime through phishing websites which threaten the property and privacy of the Internet citizen.This thesis analyzes the development of phishing detection technology based on feature group and give an example of the graduation project,elaborates the background of the project,analyzing the developing technology,design structure and the working theory of each part ,plus the test result. Keywords Internet Security Internet Phishing feature sets 目 次 1 引言 1 1.1 钓鱼攻击定义 1 1.2 研究现状 3 2 基于特征组合的钓鱼网页检测 4 2.1 算法流程 4 2.2 网页特征向量 7 2.2.1 特征1:网页PR值 7 2.2.2 特征2:网站PR值 8 2.2.3 特征3:网页链入数 9 2.2.4 特征4:网站链入数 9 2.2.5 特征5:网站百度收录页面 10 2.2.6 特征6:网页链接数 11 2.2.7 特征7:网页内部链接数 11 2.2.8 特征8:网页表单数 11 2.2.9 特征9:网页表单链出数 12 2.2.10 特征10:网页密码框 12 2.2.11 特征11:网页图片数 13 2.2.12 特征12:网页动态链接 13 2.2.13 特征13:网页可疑链接数 14 2.2.14 特征14:网页空链接数 14 2.2.15 特征15:网页本域名外部请求 14 2.2.16 特征16:网页外部请求 15 2.2.17 特征17:网页外部链接数。 15 2.2.18 特征18:已经获取的页面数 15 3 实现结果 16 结 论 22 致 谢 23 参考文献24 1 引言 在1987年,在因特网进入人们生活几十年后的的一天,世界上记录在案的第一次钓鱼犯罪案件悄无深吸地发生了 。直到今天,被发现的钓鱼网站的数目一直在不断攀升。据中国反钓鱼联盟(APAC)于2015年3月最新发布的报告指出,直至15年3月,APAC总共举报并处理228133个钓鱼网站,其中,涉及网购网站如淘宝网,各大银行如中国银联,工商银行,招商银行等四家大型银行单位的钓鱼网站总数占全部钓鱼网站总量的98.45%,冒充淘宝网的钓鱼网站位居首位。[1] (责任编辑:qin) |