邮件服务器搭建 (6) 反垃圾邮件
本帖最后由 一生有你 于 2014-12-8 00:09 编辑关于协议方面点到为止,目前基本上能够发信,收信,自动回复。
下面重点看一些反垃圾邮件的措施。国际反垃圾邮件基本基于贝叶斯分析,还有一些特殊的措施。
比如如下:
[*]网易
种反垃圾邮件网关系统及方法。该系统包括:邮件样本数据库,用于存储各种邮件样本;邮件特征挖掘模块,用于从邮件样本数据库中获取邮件样本,将该邮件样本与所有的中心点进行比对,如果相似性小于一定的阈值则直接将样本加入到该中心点,其中每个中心点为一类样本的代表,在计算邮件样本与中心点的相似性时,将邮件样本与中心点分别解析为多个部分内容,针对每个部分比较二者的相似性,根据各个部分的相似性进行加权组合获得邮件样本与中心点的全局相似性。样本数据库特征数据库利用本发明的系统和方法,对突然爆发的垃圾邮件类型等都有较好的适应性,垃圾邮件漏判率低、实时性好,人工干预小,系统可收缩性好。
[*]腾讯
反垃圾邮件的方法,包括以下步骤:A.接收到外域或本域的邮件;B.采用相似度分析算法解析判断该邮件是否为垃圾邮件;C.根据步骤B的判断,对该邮件进行发送或者拦截处理。同时本发明还提供一种采用反垃圾邮件方法的邮件服务器。本发明的方案通过对相似的垃圾邮件样本特征的分析,能够十分准确的拦截垃圾邮件,并且本发明的规则提炼可以实时进行,时效性非常强,一个拦截规则一旦生成,则可以立即实时生效进行拦截;本发明采用C/S架构的判断结构,一方面可以大幅度提升过滤率,另一方面可以提高判断效率。<font face="微软雅黑" size="3">a)将第一电子文本段和第二电子文本段分别按照相同的转换规则转换为第一矩阵和第二矩阵,所述第一矩阵和第二矩阵具有相同的尺寸;(b)依次比较第一矩阵和第二矩阵的相同位置的元素并根据比较结果使用指定比较函数计算相似系数;(c)根据相似系数判断所述第一电子文本和第二电子文本是否相似,若所述相似系数大于指定阈值则表示第一电子数据段与第二电子数据段相似。本发明还公开了一种对应的电子文本比较系统及反垃圾邮件系统。本发明通过比较电子文本的转移矩阵来计算电子文本的相似性,不但能够识别出内容完全一致的电子文本,还能够判断插入了一定随机字符的电子文本的相似性。</font>将寄来电子邮件的地址与预设的白名单内的邮件地址比对,如果寄来电子邮件地址存在于白名单内,则接受该邮件,如果寄来电子邮件的地址不存在于白名单内;则将寄来电子邮件的地址与预设的黑名单内的邮件地址比对,如果寄来电子邮件的地址存在于黑名单内,则拒收该邮件,如果寄来电子邮件的地址不存在于黑名单内;则验证邮件发送者应收件者要求所提供的收件者自定义的验证信息,如果邮件发送者的验证信息正确,则接受该邮件,如果邮件发送者的验证信息错误,则拒收该邮件。
简要概述下腾讯的反垃圾算法:
[*]1、相似度分析
[*]2、矩阵匹配
[*]3、垃圾邮件样本分析
[*]4、与收件人互动
每个帖子 我都改了不下10遍改来改去 不知道是论坛问题 还是我的浏览器兼容问题,每次结果都是一样。。难看
凑合看吧,想要源文档的直接私信我就好
复制粘贴能认真点不,去掉html标签。这是腾讯的专利刊文,转载了就要精? blackhat 发表于 2014-12-7 21:05
复制粘贴能认真点不,去掉html标签。这是腾讯的专利刊文,转载了就要精?
我卸载evernote上很好的,不知道为啥粘贴复制到这这里格式全变,
不太会发帖,就凑活看了。没指着这个设精,这个是转载的,求设精的是第一篇,部署文档。
很多人都不知道这个,有个什么群邮的玩意儿一直拿着这个忽悠人,所以发出来,给大家看看 blackhat 发表于 2014-12-7 21:05
复制粘贴能认真点不,去掉html标签。这是腾讯的专利刊文,转载了就要精?
我卸载evernote上很好的,不知道为啥粘贴复制到这这里格式全变,
不太会发帖,就凑活看了。没指着这个设精,这个是转载的,求设精的是第一篇,部署文档。
很多人都不知道这个,有个什么群邮的玩意儿一直拿着这个忽悠人,所以发出来,给大家看看
页:
[1]