采集站规避方法
本帖最后由 weiai789 于 2016-1-25 14:05 编辑好看的,可读的内容用JS输出。
打乱,骗搜索引擎的内容直接输出,当然这一部分要隐藏掉,或者缩成1像素,我采用的是后一种。
这样访客看到的是干净,有价值的内容;搜索引擎看到的是原创的内容。
如何组装原创内容,可以看一下YOO版主的帖子。
这个方法现在还能用? wjw_biter 发表于 2016-1-25 14:07
这个方法现在还能用?
有人用,比直接采了,放上去好些 怎么把采集来的中文内容批量翻译成英文 culong 发表于 2016-1-25 14:22
怎么把采集来的中文内容批量翻译成英文
这个没搞过,思路可以哟,直接丢百度或者谷歌翻译试试 用谷歌批量翻译不行的,有限制。另外LZ是做国内中文的吗? 需要技巧搞 原创性增强了,但是收录呢 GG收录的还是真实内容吗 gg应该还是能爬到js内容的,有点类似cloaking 采集不就是为了省力
如果还要花力气去组装原创
不如直接原创 这是能用来做做百度 妖妖 发表于 2016-1-25 17:43
这是能用来做做百度
我就这样搞得,流量还行,只是不知道能持续多久,5个多月了,我一直等着谷歌K我;P
站就不发了,一会儿谁跟踪我就麻烦了
yzd471790585 发表于 2016-1-25 17:18
gg应该还是能爬到js内容的,有点类似cloaking
如果真要完全屏蔽,那么可以通过判断是否是google来路。
如果是搜索来的,就显示正常内容;如果其他来路,比如爬虫,那么就打乱重组它 干货王!分享了思路顺便也分享程序啊:lol 这个以前想过只是没行动
页:
[1]
2