AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

Binom
 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利广告开户独立站⚡️开户投放
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB二三解0.1元一个虚拟卡|PTM星际卡FB专用虚拟卡Google、Bing官方总代  联盟流量开户
FB账号资源/稳定靠谱/运行5年啦FB开户代投/三不限/白名单fb耐用号0.01一个fb账号官方合作商
搜索套利开户❤️Bigo/Kwai/MediagoFB资源,账单户,分享户,国内一手FB企业户BM户账单户源头广告位出租
查看: 6354|回复: 5

关于清洗邮箱数据的一些经验

[复制链接]

18

主题

332

广告币

501

积分

中级会员

Rank: 3Rank: 3

积分
501
发表于 2020-9-19 23:19:11 | 显示全部楼层 |阅读模式
好久没上论坛了,分享一些自己清洗邮箱数据的一些经验。有时候遇到问题一个人琢磨难免走弯路,希望能抛砖引玉,有更多的大佬来分享经验和心得。

由于靠自己收集邮箱的效率实在太慢,所以做EDM营销经常会找一些爆裤的数据,或者一些内部LIST。而这些LIST经常会有很多的bad email和spam traps。对于一些高手来说,硬弹比较容易清洗,但spam traps却更为麻烦,往往一个IP没发多少邮件就进SBL和RBL,就是因为这些traps。

先说TLD邮箱,我个人很少发tld邮箱,因为实在是太难inbox了,而且限制发信频率20封/h,今天看到 @blackhat 大佬写的warm up贴子,很受启发,有空了实验一下。

以gmail为例,我的办法是用自动脚本去尝试登录google,如下所示,再用脚本抓取特征值"Couldn't find your google account",从而判断这个邮箱是存在还是不存在。HT和YH也是同样的办法。


接下来说普通邮箱的清洗步骤:

第一步,仍然是用正则,把一些常见的比如info@, sales@, 类似的邮箱先去除掉。


第二步,假如你有一份1000w邮箱的list,先把这份list提取出域名列表并去重复。然后再用 nslookup 去依次检查域名的mx记录。


nslookup -qt=MX example.com 8.8.8.8 >>example.txt


我们知道有很多的parked domain,而这些域名的邮箱几乎都是traps,比如像下面这些都是比较常见的traps MX:

mail.h-email.net
park-mx.above.com

mx37.m1bp.com
mail.b-io.co
mx156.hostedmxserver.com
mx76.mb1p.com

然后根据检查结果,把包含上面trap MX记录的域名邮箱全部删除,同时也把无MX记录的域名邮箱删除,可以减少一半以上的硬弹。如果你想不发印度国家的邮箱,也可以把MX检查结果是.in域名的删除掉。

用bat批处理加少量的代理就可以迅速完成。


第二步过滤完后,一般就可以发信了。如果要进一步处理,可以用爬虫脚本,通过特征值分析域名的网站是否是正常网站。比如网站包含下面这些关键词的域名邮箱,都删除。

ingratitudeanthokyan.xyz
google.com/adsense/domains/caf.js
parkingcrew.net
sedoparking.com
parkingcrew.com
cdnpark.com
hugedomains.com/domain_profile.cfm
gdforsale/static/js/main.e03b2f7b.js
www.namex.com/m/
www.register.com/
www.website.ws/wc_landing.dhtml
networksolutions.com/cgi-bin/promo/domain-search?domainNames=
uniregistry.com/market/domain/
/de/saleslead/?domain=
courtesy.register.it/index.html
park-your-domain.com
servers.syrahost.com
parked.rebel.ca
www.ovh.com
www.names.co.uk
www.arsys.es
kas.all-inkl.com/skel/allinkl.png
underconstruction.networksolutions.com
www.gandi.net/en/domain
my.a2hosting.com
unpublish_image.jpg
www.1and1.com
www.online-gesundheitsschutz.de/Mittelstaedt/
hostgator.com
register.be
dan.com/buy-domain
domain is available
domain is not supported
domain name is for sale
domains for sale
Domain for Sale
Domain For Sale
domain is for sale
domain may be for sale
domain name may be for sale
domain name is for sale
domain name for sale
domain might be for sale
domain is already registered
Domain Name For Sale
Domain is for Sale
Domain Parking
freeparking
Parkpage
ParkingPage
parked-domains
data-adblockkey=
Account Suspended
Something's wrong
Account has been suspended
Inquire about this domain
Buy this domain
website is for sale
Acquire this domain
The seller of the domain
Contact Domain Owner
contact the domain
information about this domain
pending renewal or deletion
purchase the domain
sale the domain
buying this domain
disposable email
register your domain
Domain Name Registration
parked for FREE
Is this your domain
Fake Email
fake mail
email generator
fakemail
temp mail
tempmail
temporary email
temp-mail
disposable mail
trash-mail
fake-mail
Email Receipt Testing
email testing
test email
Bid On This Domain
Renew Your Domain
Backorder Domain
domain has just been registered
Your New Hosting Package
owner of this domain
Welcome again to A2 Hosting
Create a Website
web server
your own domain name
Find a domain name
DOMAIN HAS JUST BEEN REGISTERED
DOMAIN REGISTRATION
WEBHOSTING


几年前也用过象GSA email verifier这种工具,效率很低且对p!r!o!x!y要求较高。用我这个办法清洗list,大部份traps和硬弹都能过滤掉,不足之处是需要尽可能多的积累一些特征值,如果再配合ip warm up,SBL的概率会降低很多,发信效率更高。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

评分

参与人数 2广告币 +16 收起 理由
朝阳风雨 + 10 很给力!
老刘 + 6 666

查看全部评分

相关帖子
回复

使用道具 举报

1621

主题

2万

广告币

2万

积分

管理员

宇宙无敌河马天神

Rank: 9Rank: 9Rank: 9

积分
29734

社区QQ达人

发表于 2020-9-21 13:38:35 | 显示全部楼层
spam 是费力不讨好的事情

关于data clean,一般是找那些第三方的数据公司来操作

当然了,其实能挣大钱的还是gmail, yahoo 和 outlook 这些TLD domain
学会提问的艺术, 从小处入手, 忌大而空
AdvertCN电报群

我最喜欢用的工具
7200W全球动态不重复住宅IP代理
回复 支持 1 反对 0

使用道具 举报

12

主题

654

广告币

789

积分

中级会员

Rank: 3Rank: 3

积分
789
发表于 2020-9-20 07:18:24 | 显示全部楼层
有道理,感谢!!!
.
寻----兼职机会★懂英语★熟外贸★写文案★会视频剪辑
V❤:丫iωu⑤①⑧⑧
.
.
回复 支持 反对

使用道具 举报

19

主题

297

广告币

484

积分

中级会员

Rank: 3Rank: 3

积分
484

社区QQ达人

QQ
发表于 2020-10-5 06:30:33 | 显示全部楼层
其实洗数据我一直用一个比较简单的方法:申请两个支持smtp的国外平台,先用A账户发一遍类似“text email”的简单内容,再导出到达和打开的邮箱,最后在用B正常发信就可以了。前提是你A账户硬弹小于平台的规定值,最开始需要简单的用软件洗一遍,要不然很容易封号!~

点评

有traps boot会自动爬你的邮件,你只看到达和打开只能抓出硬弹。  详情 回复 发表于 2020-10-26 16:17
Sendclouder.com邮件中国论坛创始人
回复 支持 反对

使用道具 举报

18

主题

332

广告币

501

积分

中级会员

Rank: 3Rank: 3

积分
501
 楼主| 发表于 2020-10-26 16:17:52 | 显示全部楼层
拿破仑 发表于 2020-10-5 06:30
其实洗数据我一直用一个比较简单的方法:申请两个支持smtp的国外平台,先用A账户发一遍类似“text email” ...

有traps boot会自动爬你的邮件,你只看到达和打开只能抓出硬弹。
回复 支持 反对

使用道具 举报

19

主题

297

广告币

484

积分

中级会员

Rank: 3Rank: 3

积分
484

社区QQ达人

QQ
发表于 2020-10-26 16:45:29 | 显示全部楼层
恩,谢谢!~·
Sendclouder.com邮件中国论坛创始人
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-12-22 09:17 , Processed in 0.049307 second(s), 15 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表