基于python语言的分类器的设计与实现(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于python语言的分类器的设计与实现(4)

从互联网(ARPANET)刚刚成立之时,就已经禁止发送垃圾邮件。加里·图尔克在1978年将第一封电子邮件垃圾邮件发送给600人。他被斥责并被告知禁止再做此事。垃圾邮件的禁止是由互联网服务提供商(ISP)的服务条款 / 可接受使用政策(ToS / AUP)和同侪压力执行的。文献综述

3.2 垃圾邮件的分类

垃圾邮件根据有来源有几个不同的定义;

(1) 未经请求的大量电子邮件(UBE) - 大量发送的未经请求的电子邮件。

(2) 未经请求的商业电子邮件(UCE) - 这种限制性更强的定义被授权管理商业的监管机构(如美国联邦贸易委员会)使用。

(3) 垃圾邮件网站

许多垃圾邮件都包含网站或网站的URL。根据2014年的Cyberoam报告,平均

每天发送的垃圾邮件数达到540亿。“医药产品(伟哥等)从上个季度的分析上涨了45%,领先本季度的垃圾邮件,电子邮件中声称可以快速,便捷地提供现金的排在第二位,约占垃圾邮件的15%。而第三名则是关于饮食保健类产品的垃圾邮件(例如减肥药、保健药等等),约占1%。

(4) 广告中最常见的产品

根据Commtouch Software Ltd.编制的资料,2010年第一季度的电子邮件垃圾邮件可以分类如下:

表4.1 垃圾邮件主题

药品、保健品 81%

仿品 5.4%

增强剂 2.3%

网络钓鱼网站 2.3%

学历学位 1.3%

赌场 1%

减肥 0.4%

其他 6.3%

(5) 网络钓鱼

垃圾邮件也是一种媒介。骗子在电子邮件中对一些虚假网站进行伪造,让用户在看起来像银行或其他正规组织的虚假网站上填入个人信息,这就是所谓的网络钓鱼。一些有针对性的网络钓鱼,即根据需要窃取的收件人信息有针对性的创建电子邮件,被称为鱼叉式网络钓鱼。

3.3 垃圾邮件的危害

互联网给我们的带来的最具话题性的副产物算是垃圾邮件,它的扩散打破了整个互联网。

3.3.1 欺诈

垃圾邮件发送者可能会故意欺诈他人发送信息。垃圾邮件发送者经常使用虚假名称,地址,电话号码和其他联系信息在各种互联网服务提供商设置“一次性”帐户。他们还经常使用伪造或被盗的信用卡号码来支付这些帐户。这允许他们在被ISP发现并关闭每个帐户前快速从一个帐户移动到下一个帐户。来,自|优;尔`论^文/网www.youerw.com

发信人可能会竭尽全力掩盖他们的信息的来源。大公司可能会雇用另一家公司来发送他们的信息,这样投诉或阻止电子邮件的源头就都落在第三方。还有一部分人对电子邮件地址进行伪造(比IP地址欺骗容易得多)。电子邮件协议(SMTP)在默认情况下不进行身份验证,因此垃圾邮件发送者可以假装从任何电子邮件地址发出消息。为了防止这种情况,一些ISP和域需要使用SMTP-AUTH,对异常的电子邮件发起者的帐户进行身份识别。

当然发件人也不可能完全欺骗电子邮件传递链(“收到”的那一端),因为接收邮件服务器记录了最后一个邮件服务器的IP地址的实际连接。为了解决这个问题,一些垃圾邮件散布者伪造了额外的邮件标题,使得邮件似乎已经经过了许多合法的服务器。 (责任编辑:qin)