从0开始做个聚合站
本帖最后由 James_Liu 于 2015-9-4 10:28 编辑楼主一致设想有个项目能够赚钱,思来想去,除了河马大大的域停,就只有采集站比较适合了。楼主不喜欢采集站这个名字,姑且冠冕堂皇的称之为聚合站吧!开干:
1,工具:Linode 20USD + Bluehost Domain + Wordpress + Python2,思路:利用Python采集文章站文章,处理后发送到Wordpress上。最核心的是采集后的内容处理,目前进行了如下几个操作: 1)全文语句顺序随机打乱,即把原文切分成句子,然后句子顺序乱排。 2)对于单句,进行随机插入单词、插入广告代码(目前用的Adsense)、删除部分单词。这样处理过后,整个句子基本面目全非、狗屁不通了。 3)随机取单词生成Tag和Category3,发布效果:首先采集了一些列dating相关的文章进行测试。站点主页使用tag标签生成,形似craigslist.插件使用了sitemap xml。
全部的工作实现无人看守自动化,计划采集10万篇文章发布出来,看看效果。网站稍后放出来给大家看~ 欢迎大家提建议。 垃圾站不看好啊。。。 有啥用? 忽悠google广告? 楼主自己开发的采集工具? 静候楼主后续报道!同样思路我做过,没效果,不知道问题在哪。看看楼主的效果 这个要关注! 关注一下 lz我正想学python做采集,请问网上有什么教程好推荐吗?对于0基础无编程经验者 谷歌会识别到你这些垃圾内容,然后封站 这种采集改写站很难生存了吧,除非手动改写 wqz 发表于 2015-9-1 12:35
静候楼主后续报道!同样思路我做过,没效果,不知道问题在哪。看看楼主的效果 ...
一起交流啊! 这个过程估计会比较慢才能看到效果,我计划做个英文站,再做个中文站试试。 我对你的采集技术感兴趣 空格无敌 发表于 2015-9-1 15:28
我对你的采集技术感兴趣
如果能提供有效的建议,一经采纳,所有源代码发个你。:lol James_Liu 发表于 2015-9-1 17:34
如果能提供有效的建议,一经采纳,所有源代码发个你。
这种站靠SEO是很难的,试试社交流量,社交流量上来了也很好的。 楼上正解,走流量SEO可能不太合适