James_Liu 发表于 2015-9-1 10:08:40

从0开始做个聚合站

本帖最后由 James_Liu 于 2015-9-4 10:28 编辑

楼主一致设想有个项目能够赚钱,思来想去,除了河马大大的域停,就只有采集站比较适合了。楼主不喜欢采集站这个名字,姑且冠冕堂皇的称之为聚合站吧!开干:
1,工具:Linode 20USD + Bluehost Domain + Wordpress + Python2,思路:利用Python采集文章站文章,处理后发送到Wordpress上。最核心的是采集后的内容处理,目前进行了如下几个操作:    1)全文语句顺序随机打乱,即把原文切分成句子,然后句子顺序乱排。    2)对于单句,进行随机插入单词、插入广告代码(目前用的Adsense)、删除部分单词。这样处理过后,整个句子基本面目全非、狗屁不通了。    3)随机取单词生成Tag和Category3,发布效果:首先采集了一些列dating相关的文章进行测试。站点主页使用tag标签生成,形似craigslist.插件使用了sitemap xml。
全部的工作实现无人看守自动化,计划采集10万篇文章发布出来,看看效果。网站稍后放出来给大家看~ 欢迎大家提建议。

hengz 发表于 2015-9-1 10:41:31

垃圾站不看好啊。。。

impig33 发表于 2015-9-1 10:45:14

有啥用? 忽悠google广告?

ggnyj2008 发表于 2015-9-1 11:51:12

楼主自己开发的采集工具?

wqz 发表于 2015-9-1 12:35:21

静候楼主后续报道!同样思路我做过,没效果,不知道问题在哪。看看楼主的效果

billy 发表于 2015-9-1 12:39:31

这个要关注!

boling 发表于 2015-9-1 14:31:27

关注一下

c21xdx 发表于 2015-9-1 14:40:57

lz我正想学python做采集,请问网上有什么教程好推荐吗?对于0基础无编程经验者

牧羊人 发表于 2015-9-1 14:50:01

谷歌会识别到你这些垃圾内容,然后封站

laoyebin 发表于 2015-9-1 15:01:06

这种采集改写站很难生存了吧,除非手动改写

James_Liu 发表于 2015-9-1 15:10:14

wqz 发表于 2015-9-1 12:35
静候楼主后续报道!同样思路我做过,没效果,不知道问题在哪。看看楼主的效果 ...

一起交流啊! 这个过程估计会比较慢才能看到效果,我计划做个英文站,再做个中文站试试。

空格无敌 发表于 2015-9-1 15:28:03

我对你的采集技术感兴趣

James_Liu 发表于 2015-9-1 17:34:28

空格无敌 发表于 2015-9-1 15:28
我对你的采集技术感兴趣

如果能提供有效的建议,一经采纳,所有源代码发个你。:lol

空格无敌 发表于 2015-9-1 18:14:23

James_Liu 发表于 2015-9-1 17:34
如果能提供有效的建议,一经采纳,所有源代码发个你。

这种站靠SEO是很难的,试试社交流量,社交流量上来了也很好的。

Lebron.Meng 发表于 2015-9-1 20:56:14

楼上正解,走流量SEO可能不太合适
页: [1] 2 3 4
查看完整版本: 从0开始做个聚合站