weiai789 发表于 2016-1-21 12:47:25

楼下哥们儿说"采集必死",我只想说“呵呵”

本帖最后由 weiai789 于 2016-1-22 14:22 编辑

真的采集必死?做了才知道。规避GOOGLE规则得永生。
往往话说太绝对的人,我就只能“呵呵”。君不见诸多采集站还好好地活着,每天收着美刀。包括我。

做采集站目的是为了钱,放开手脚干,别怕。死了就一点服务器费用而已,你干了再说,特别是新手,有思路,一定要去做。很多项目都可以赚钱,但是很多人只是停留在想的阶段。

做采集站被K怕什么,我有一群站,有本事全K了。为了钱,值得一搏,我很俗,哈哈。
在这儿给伙伴们分享一个做采集和自动登录发帖的好东西,python+selenium、验证码打码平台

我现在基本是全自动化的在搞,避免人工。
代理你要自己去搞定。


#######################
采集站对用户有价值,即使google全部K了,还可以自己去做推广,特别是娱乐站还是很好推的。######################
娱乐站用来引流到微信账号,用微信形成长期的流量,比把流量直接卖给广告联盟好些,变形不是一定要走广告联盟,现在厂商一大把,直接找厂商,别走代理商,你说要代理它的产品。
##################################
说到自动化,谈谈桌面端,给大家介绍一个软件:AutoIt

这东西可以做什么?模拟点击。真好东西,很多你意想不到的功能,会让你兴奋地跳起来。








spian2008 发表于 2016-1-21 12:55:43

话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。;P

aabbccli 发表于 2016-1-21 15:20:10

ads419 发表于 2016-1-21 14:54
刚才了解了一下,这个是自动化工具,我以为是爬虫,用爬虫也有专门的JS渲染插件。 ...

爬虫的JS渲染插件也是用的WEBKIT内核,比如pyspider就是用的phantomjs来渲染JS,和selenium调用phantomjs渲染效果一样。不过好像pyspider是把phantomjs运行起来当作服务器调用的(可以通过ip调用),而selenium是通过子进程调用来实现的,应该是pyspider性能要好一点吧。

early 发表于 2016-1-21 12:59:18

:):)只要搜索存在,采集必定存在

wxmd 发表于 2016-1-21 13:00:13

再怎么折腾,采集站是长久不了的,一个字:累

c21xdx 发表于 2016-1-21 13:00:31

我就会用火车头采集,直接采直接发,效果不大好,求采集大神带我啊。。。。。。。。。。。。。

节操 发表于 2016-1-21 13:02:48

谁手一搜一堆采集站。。也不知道谁说的采集站不行的。。

weiai789 发表于 2016-1-21 13:20:45

spian2008 发表于 2016-1-21 12:55
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。 ...

百度的采集其实比GOOGLE好做,做过的都知道,只是要有点耐心和长期定时更新。

当然文章内容有用更好。

weiai789 发表于 2016-1-21 13:23:52

c21xdx 发表于 2016-1-21 13:00
我就会用火车头采集,直接采直接发,效果不大好,求采集大神带我啊。。。。。。。。。。。。。 ...

采集要有规律,不要一下采集太多,每天定时发几十篇,不要一下子发出去。最重要的一点,耐心。

做10个站,这样去干,等一年再看结果。我只能说,坚持做,耐心。

lwbing 发表于 2016-1-21 13:25:24

SEM9 8K的书 就是采集能活的要点!;P

weiai789 发表于 2016-1-21 13:37:40

我现在后台都懒得登录,全用python去搞,很省心。

ads419 发表于 2016-1-21 14:25:34

weiai789 发表于 2016-1-21 13:37
我现在后台都懒得登录,全用python去搞,很省心。

采集新手路过,你是用scrapy还是pyspider?

修身养性 发表于 2016-1-21 14:32:13

采集死是死,永远死不完...........

修身养性 发表于 2016-1-21 14:33:20

spian2008 发表于 2016-1-21 12:55
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。 ...

如果是这种站,量化

weiai789 发表于 2016-1-21 14:49:48

本帖最后由 weiai789 于 2016-1-21 14:51 编辑

ads419 发表于 2016-1-21 14:25
采集新手路过,你是用scrapy还是pyspider?
BeautifulSoup用来解析 html

selenium用来做自动登录,有些内容是动态js调用的,比如QQ空间这种,你用c++这些做的话,会很头大,分析加密算法之类,但是用selenium,就相当于你在用python操作浏览器,可以做到有界面和无界面2种,比如firefox和phantomjs。
有验证码的,要么自己搞验证码,要么花钱调用打码平台的接口。做游戏外挂话的你就知道这些。

白龙君 发表于 2016-1-21 14:51:16

:Q 除了火车头还能用啥采集啊。。。。。。。。
页: [1] 2 3
查看完整版本: 楼下哥们儿说"采集必死",我只想说“呵呵”