tufei
发表于 2016-1-24 17:17:03
weiai789 发表于 2016-1-21 14:49
BeautifulSoup用来解析 html
selenium用来做自动登录,有些内容是动态js调用的,比如QQ空间这种,你用c++ ...
请楼主推荐几个收费的打码平台。能识别吗?
JasonLee
发表于 2016-1-26 22:25:30
spian2008 发表于 2016-1-21 12:55
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。 ...
国内主机备案好麻烦 用国外主机没影响吧?
gaozi
发表于 2016-2-24 10:21:17
楼主是采集高手
ibq00
发表于 2016-3-9 12:08:47
牛逼的采集站
maodelife
发表于 2016-4-6 11:41:46
说的,我都想学学python。
myfamile
发表于 2016-5-3 16:48:18
最开始我也是鄙视采集的,觉着没钱途,不过看到很多家伙靠采集新闻和快速更新的高关注度的内容,数钱数到手抽筋,我TM也“觉悟”了,其实,采集并不像大多数人想的那么无脑,还是需要重新编辑的,不然搜索引擎不干你,目标客户也不干呀。
sdwzzx
发表于 2016-7-14 17:53:46
weiai789 发表于 2016-1-21 14:53
真要做全自动,一定要学python
还有一些,比如验证码和代理。这2个可以用钱解决。 ...
我也在学python,之前采集都是用bash curl的,感觉还是python效率高些
marco896388823
发表于 2016-8-11 10:07:26
那文章我主要是说采集和搜索引擎之间的关系好吧?!
不处理采集问题,搜索引擎会被采集网站“淹”死,