楼下哥们儿说"采集必死",我只想说“呵呵”
本帖最后由 weiai789 于 2016-1-22 14:22 编辑真的采集必死?做了才知道。规避GOOGLE规则得永生。
往往话说太绝对的人,我就只能“呵呵”。君不见诸多采集站还好好地活着,每天收着美刀。包括我。
做采集站目的是为了钱,放开手脚干,别怕。死了就一点服务器费用而已,你干了再说,特别是新手,有思路,一定要去做。很多项目都可以赚钱,但是很多人只是停留在想的阶段。
做采集站被K怕什么,我有一群站,有本事全K了。为了钱,值得一搏,我很俗,哈哈。
在这儿给伙伴们分享一个做采集和自动登录发帖的好东西,python+selenium、验证码打码平台
我现在基本是全自动化的在搞,避免人工。
代理你要自己去搞定。
#######################
采集站对用户有价值,即使google全部K了,还可以自己去做推广,特别是娱乐站还是很好推的。######################
娱乐站用来引流到微信账号,用微信形成长期的流量,比把流量直接卖给广告联盟好些,变形不是一定要走广告联盟,现在厂商一大把,直接找厂商,别走代理商,你说要代理它的产品。
##################################
说到自动化,谈谈桌面端,给大家介绍一个软件:AutoIt
这东西可以做什么?模拟点击。真好东西,很多你意想不到的功能,会让你兴奋地跳起来。
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。;P ads419 发表于 2016-1-21 14:54
刚才了解了一下,这个是自动化工具,我以为是爬虫,用爬虫也有专门的JS渲染插件。 ...
爬虫的JS渲染插件也是用的WEBKIT内核,比如pyspider就是用的phantomjs来渲染JS,和selenium调用phantomjs渲染效果一样。不过好像pyspider是把phantomjs运行起来当作服务器调用的(可以通过ip调用),而selenium是通过子进程调用来实现的,应该是pyspider性能要好一点吧。 :):)只要搜索存在,采集必定存在 再怎么折腾,采集站是长久不了的,一个字:累 我就会用火车头采集,直接采直接发,效果不大好,求采集大神带我啊。。。。。。。。。。。。。 谁手一搜一堆采集站。。也不知道谁说的采集站不行的。。 spian2008 发表于 2016-1-21 12:55
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。 ...
百度的采集其实比GOOGLE好做,做过的都知道,只是要有点耐心和长期定时更新。
当然文章内容有用更好。 c21xdx 发表于 2016-1-21 13:00
我就会用火车头采集,直接采直接发,效果不大好,求采集大神带我啊。。。。。。。。。。。。。 ...
采集要有规律,不要一下采集太多,每天定时发几十篇,不要一下子发出去。最重要的一点,耐心。
做10个站,这样去干,等一年再看结果。我只能说,坚持做,耐心。 SEM9 8K的书 就是采集能活的要点!;P 我现在后台都懒得登录,全用python去搞,很省心。 weiai789 发表于 2016-1-21 13:37
我现在后台都懒得登录,全用python去搞,很省心。
采集新手路过,你是用scrapy还是pyspider? 采集死是死,永远死不完........... spian2008 发表于 2016-1-21 12:55
话说国外的采集我没弄过。国内的目前弄了几十个站,目前反正是赚钱的。全自动。除了成本。不用管。 ...
如果是这种站,量化 本帖最后由 weiai789 于 2016-1-21 14:51 编辑
ads419 发表于 2016-1-21 14:25
采集新手路过,你是用scrapy还是pyspider?
BeautifulSoup用来解析 html
selenium用来做自动登录,有些内容是动态js调用的,比如QQ空间这种,你用c++这些做的话,会很头大,分析加密算法之类,但是用selenium,就相当于你在用python操作浏览器,可以做到有界面和无界面2种,比如firefox和phantomjs。
有验证码的,要么自己搞验证码,要么花钱调用打码平台的接口。做游戏外挂话的你就知道这些。
:Q 除了火车头还能用啥采集啊。。。。。。。。