yahoo21cn 发表于 2013-11-1 14:25:54

我也要搞个日记形式的,暂定1000$/month吧

本帖最后由 yahoo21cn 于 2013-11-1 14:50 编辑

最开始做过click2net,后来这家倒闭了,再后来也搞过gg,莫名其妙的被封号了,损失惨重,就再没接触过网络赚钱。现在迫于生计准备重新开始了。计划还是使用老技术,海量采集后,把数据处理下,做成静态页面,放到vps上。准备先从cb入手,也会考虑cj。之前已经写过部分的程序了。

程序分为:
前端采集程序,框架已经搭起来了,可以实现web页面的监视和操控,现在正在写第一个站点的采集模块。计划实现几十个项目的同事采集。

中间层部分程序还没有写,准备等前后端的都写完再写这个连接部分。主要功能是按照顺序把被采集到的数据从数据库中读出给后端处理程序,之所以要这个中间层,是因为后端处理程序是多线程的,避免同时处理一条数据的情况发生。

后端数据处理程序框架和大部分模块已经完成。

预计还至少一周时间才能正式开始第一个站的处理,因为主要是每天下班后才有时间写一点,所以进展缓慢。

※此鑫不变※² 发表于 2013-11-1 14:43:17

额 霸气~~~~

zhj80 发表于 2013-11-1 15:52:12

关注楼主进度

xizi1023 发表于 2013-11-1 17:53:26

懂技术的搞起采集来,真是爽利~

河小马 发表于 2013-11-2 02:19:41

霸气~~~~

e688w 发表于 2013-11-2 08:57:58

不是有采集程序吗?干吗还费事写一个啊

yahoo21cn 发表于 2013-11-2 21:52:34

十年前的亚马逊帐号已经莫名被封了,从来没用过的.听说现在注册不了了,就先只做cb吧.今天先买了个vps.

今年赚大刀 发表于 2013-11-2 22:51:51

霸气~~~~

yahoo21cn 发表于 2013-11-3 01:52:11

e688w 发表于 2013-11-2 08:57 static/image/common/back.gif
不是有采集程序吗?干吗还费事写一个啊

因为要对数据进行处理,处理部分没有现成的程序,得自己写.

young 发表于 2013-11-3 22:20:51

霸气~~~~

JasonLee 发表于 2013-11-3 22:30:01

哥们是用什么语言写的

感觉采集也要有自己的思路 照着搬来的现在肯定行不通了

yahoo21cn 发表于 2013-11-5 22:17:28

之前因为在ubuntu上测试mysql无法使用软链接把库分在多个盘上,所以决定用postgresql,花了很长时间寻找和调试pg的连接池和管理软件,最后发现pg的问题太多,贪污了几天时间,今天转回了mysql,并且发现是ubuntu系统的问题导致mysql软链接失效的,mysql是支持软链接的,我也够倒霉的,从网上搜到仅仅是ubuntu有这个问题,其他的linux系统如centos或windows都没这个问题.
今天已经开始采集第一个站了,现在开始去写数据处理和连接池中间件,不能直接就把数据发出去,会被gg判定为负值站的.

yahoo21cn 发表于 2013-11-5 22:17:51

JasonLee 发表于 2013-11-3 22:30 static/image/common/back.gif
哥们是用什么语言写的

感觉采集也要有自己的思路 照着搬来的现在肯定行不通了 ...

python

yahoo21cn 发表于 2013-11-6 16:38:28

忽然发现中间件可以写到数据处理部分里,那就简单了,计划今晚写这块。数据已经在采集着了。预计这周末可以上线第一个垃圾站了。一开始规划框架的时候慢,框架完善后,以后再上新站就是流水线模式了,估计会快很多。

yahoo21cn 发表于 2013-11-7 16:19:25

发现还是得写中间件,因为数据处理我之前设计的是单进程单线程,预想利用启动多个数据处理进程来充分利用多个cpu核心,写完采集的时候把这点忘记了。
最近进度太慢了,执行力堪忧,我得鞭策下自己。
页: [1] 2
查看完整版本: 我也要搞个日记形式的,暂定1000$/month吧