weiai789 发表于 2016-1-25 14:02:43

采集站规避方法

本帖最后由 weiai789 于 2016-1-25 14:05 编辑

好看的,可读的内容用JS输出。
打乱,骗搜索引擎的内容直接输出,当然这一部分要隐藏掉,或者缩成1像素,我采用的是后一种。

这样访客看到的是干净,有价值的内容;搜索引擎看到的是原创的内容。

如何组装原创内容,可以看一下YOO版主的帖子。

wjw_biter 发表于 2016-1-25 14:07:55

这个方法现在还能用?

weiai789 发表于 2016-1-25 14:16:24

wjw_biter 发表于 2016-1-25 14:07
这个方法现在还能用?

有人用,比直接采了,放上去好些

culong 发表于 2016-1-25 14:22:14

怎么把采集来的中文内容批量翻译成英文

weiai789 发表于 2016-1-25 14:23:38

culong 发表于 2016-1-25 14:22
怎么把采集来的中文内容批量翻译成英文

这个没搞过,思路可以哟,直接丢百度或者谷歌翻译试试

c21xdx 发表于 2016-1-25 14:35:43

用谷歌批量翻译不行的,有限制。另外LZ是做国内中文的吗?

一米 发表于 2016-1-25 15:51:21

需要技巧搞

Atrus 发表于 2016-1-25 17:07:23

原创性增强了,但是收录呢 GG收录的还是真实内容吗

yzd471790585 发表于 2016-1-25 17:18:41

gg应该还是能爬到js内容的,有点类似cloaking

booday 发表于 2016-1-25 17:38:32

采集不就是为了省力
如果还要花力气去组装原创
不如直接原创

妖妖 发表于 2016-1-25 17:43:12

这是能用来做做百度

weiai789 发表于 2016-1-25 17:45:45

妖妖 发表于 2016-1-25 17:43
这是能用来做做百度
我就这样搞得,流量还行,只是不知道能持续多久,5个多月了,我一直等着谷歌K我;P
站就不发了,一会儿谁跟踪我就麻烦了

weiai789 发表于 2016-1-25 18:02:38

yzd471790585 发表于 2016-1-25 17:18
gg应该还是能爬到js内容的,有点类似cloaking

如果真要完全屏蔽,那么可以通过判断是否是google来路。

如果是搜索来的,就显示正常内容;如果其他来路,比如爬虫,那么就打乱重组它

见钱开眼 发表于 2016-1-25 19:19:47

干货王!分享了思路顺便也分享程序啊:lol

54clz 发表于 2016-1-26 09:00:39

这个以前想过只是没行动
页: [1] 2
查看完整版本: 采集站规避方法