14
3。2。1训练阶段 14
3。2。2 测试阶段 15
3。3 本章小结 16
第四章 系统的实现与算法的评估 17
4。1系统的实现 17
4。2具体的代码分析 18
4。3系统的评估 21
4。3。1评估的标准 21
4。3。2评估的结果 22
4。4本章小结 23
第五章 系统测试 24
5。1系统测试的基本方法 24
5。2测试结果 24
结论 27
致谢 29
参考文献 30
第一章 绪论
1。1课题研究背景及意义
在20世纪后半叶,互联网的横空出世深刻地改变了人类的发展历程,并且改变着人们看待和思考这个世界的方式和角度[[[]王龙龙。 基于贝叶斯算法的垃圾邮件过滤系统设计与实现[D]。吉林大学硕士学位论文,2014。]] 。随后,互联网的迅速发展和个人计算机的大范围普及,意味着“信息时代”的来临。互联网的出现,打破了传统的信息传递机制,使得信息可以在全球范围内快速的传递。但随之带来的信息安全,有效问题也成为各个行业的焦点。诞生于20世纪70年代的电子邮件技术使得邮件信息交换变成了现实。由于电子邮件有着快速便捷、成本低廉、易于保存等优点,得到广大用户的肯定及使用。也使得电子邮件成为现代社会主要通讯方式之一。
时至今日,电子邮件已经成为人们生活中不可或缺的一部分,渗透在人们生活中的方方面面。根据某个网站的统计,全球范围内有80%的网民在与同事、亲友的信息交流是通过电子邮件进行的。全球的互联网用户在一年时间总共发送107万亿封邮件,相当于一天发送大约3000亿封电子邮件。然而,在给人们带来便利的同时,电子邮件同样存在着重大的漏洞。据统计,垃圾邮件占总邮件数的89%,相当于平均每天发送近2770亿封垃圾邮件。几乎所有的电子邮件用户都受垃圾邮件的困扰[[[]范仕伦,薛天俊,夏玮。 基于贝叶斯算法和费舍尔算法的垃圾邮件过滤系统设计与实现[J]。 信息网络安全,2012,09:18-22。]]。
大量垃圾邮件的出现,产生巨大的问题并且带来巨大的危害。电子邮件用户需要花费时间,精力和金钱去判断和处理垃圾邮件。甚至有的非法人员盗用别人的邮箱,盗用他人身份进行骗取他人的金钱,严重侵犯他人权利。其次,垃圾邮件还占用了互联网的资源,影响着邮件系统服务器,降低着网络的运行效率,造成巨大的经济损失。有些不法分子通过垃圾邮件渠道,传播着病毒和木马。这样在一些安全性不是很高的个人计算机中将造成系统崩盘等严重问题,影响着个人的工作和学习。更有甚者,一些反动分子和蓄意破坏社会和谐的人在垃圾邮件中传播色情,暴力和反动思想,污染了互联网的环境,扰乱人们的视听,对青少年的成长造成不良的发展方向,助长不良社会风气,严重情况下可能破坏国家的团结安定。因此,如何处理这些垃圾邮件成为全世界各国,各个互联网产业迫切需要解决的一个问题[[[]次曲(Tse Qu)。 基于朴素贝叶斯算法的藏文垃圾邮件过滤关键技术研究[D]。电子科技大学硕士学位论文,2013。]]。 java海量数据处理利器Hash在线邮件地址过滤(2):http://www.youerw.com/jisuanji/lunwen_126369.html