Come from: Bayesian Content Filtering and the Art of Statistical Language Classification
B.原文的翻译
原始语言分析
原始语言分析是匹配文本的特定短语来过滤电子邮件的过程。在最初的垃圾邮件过滤器是相当原始,并没有真正的过滤的。在真正的垃圾邮件过滤器出现前,这些原始的工具,用了一个很简单的方法,以语言分析,只需扫描电子邮件的已知发件人在邮件标题中,多个新闻组交叉张贴(发送到大量的不同论坛的消息),或短语都说明垃圾邮件,如“呼叫现在!”和“免费试用!”1994年和1997年间,没有太多的东西可以全球做一下垃圾邮件。对抗它的技术是太有限了。论文网
在垃圾邮件的初期,垃圾邮件发送者才学到了很多,他们所用的肮脏招数今日,可筛选交叉核对的垃圾邮件发件人列表名单是有些有效的,只是因为它是可能的基于单词和短语的列表已知其中大部分认为世界上只存在于垃圾邮件过滤器。基于单个词过滤一人独得的80%左右的潜在的成功率,捕与合法邮件的机会微乎其微。