朱悟能7758 发表于 2022-12-28 20:57:41

做站记录贴,盈利或失败就结贴

一:前提:
1,本人自学了点易语言,比较熟悉网页协议,技术也不行写点日用品而已。最近半年学了点go语言,英语不好,看的绕来绕去的,还没弄懂这破东西。

2,14年曾经拥有过6块比特币,嫌没价值,亏了几百块卖了。曾经也一直专心做自己的行业网站,无奈遇到诉讼流氓,几个图片说我版权问题,私了陪了几万块。一气之下,关闭了经营快10年之久的网站。连域名都没去续费。

3,最近几年工作之余偶尔帮帮朋友写一些小工具,跟第二条一样,啥都没赚到,机会也没把握住,最终还倒贴。。。

4,最近本职工作的因为疫情,闲的时候想把做站的事情在拿来出来。试试执行自己的思路看看效果如何。如果盈利就加大剂量,失败就永远离开做站。。。

二:步骤
1,12.28:今天把文章源头的采集列表,文章详情,图片水印处理,翻译,线程池,整体框架等等全部做好了。

2,翻译本想用deelp,抓的接口加了代理,发现抠出来的接口不稳定,只能短句,长文就不行,时间有限就没多研究了,暂时就用有道代替下。

3,网站程序方面,想利用go写,奈何技术太菜了,用易的cchttp或者E2ee写的话也太费事,万一不成,又白费功夫。拿dede吧,又怕他漏洞多,wp我又不熟悉,暂时就用zblog吧,因为上传图片,发布文章的接口以前写过,可以直接拿来用。

4,联盟方面:等文章站做好了,有自然流量收录了,就继续做2个站,1个全部采集速卖通,1个采集亚马逊。跟以前淘宝客网站那种形式。用js调用,插入文章右,下2个列表里。让访客能看到对应网站主题类的产品。(2个联盟采集站,就不管他收录不收录了,主要让文章站能调用,让访客看到自己感兴趣的商品,提高转化即可),至于其他联盟,到时候再说,先这2个上。

三:推广
1,目前手头的软件,先拿来跑跑试试。
2,外链方面,等站做好了。看下国外有啥cms开源方便注册的,每天去发发帖,转载下文章。
3,国外博客在看看哪些简单的,接口不复杂的,加几个博客进去转发下网站文章。提高点外链。
4,目前也想不到啥好点子了,要是有流量了,就多研究下其他联盟吧,seo方面,除了提高文章内容就是外链了。
5,后续空闲的时候,采集万把个文章,就让网站上线,主要最近阳了,又快过年了,估计一下子还搞不完。后续继续更贴说。

妖妖 发表于 2022-12-28 21:11:36

加油!!!!!!!!!!!!!!

ensky 发表于 2022-12-29 23:07:20

朱悟能7758 发表于 2022-12-29 14:56
精品站,感觉有点投注一个地方一次性梭哈了的感觉
采集站群的方式,一个站一个分类,总能找到流量密码吧 ...

这个我倒是持有不同的见解。

精品站也并不是孤注一掷,可以做多个网站啊,并不是只做一个网站,而且精品站的文章并不需要那么多,如果做的好,可能几十篇文章,就可以盈利了。不过这个盈利也看盈利多少。

我想提个关于采集站的问题。

采集站如何做站内优化?

内容如何优化,还是采集了以后,一次性生成的内容,后续不会再调整?

站内内链如何优化?还是后续没有优化?

xu6882611 发表于 2022-12-29 12:37:54

我会java以及php,前端开发也还行,我的爬虫框架是基于selenium,于10月底研发完毕。
php使用laravel框架做web展示层,全部采用接口形式,换句话说我的控制后台在大陆(总数据库),展示层的网站在国外。
laravel非常简一边开发一边看文档,一个星期就全部摸清楚了。
比如我做娱乐网站,就在控制台订阅娱乐相关文章,然后即时推送。
大杂烩的资讯站,就订阅所有类目。
我觉得用开源cms反而把你限制住。
做站群也可以基于这个思路。

lospollos 发表于 2022-12-28 21:40:11

加油:loveliness:

sead 发表于 2022-12-28 21:45:36

跌跌撞撞是常态

朝阳风雨 发表于 2022-12-28 22:33:51

加油,期待更新。

coogoo 发表于 2022-12-28 23:13:32

感谢已经很厉害了

ensky 发表于 2022-12-29 08:57:15

为啥不做精品站呢?总搞采集站。采集站就意味着无法手动优化了,都得框架优化了吧?这还真是个学问

朱悟能7758 发表于 2022-12-29 14:56:40

ensky 发表于 2022-12-29 08:57
为啥不做精品站呢?总搞采集站。采集站就意味着无法手动优化了,都得框架优化了吧?这还真是个学问 ...

精品站,感觉有点投注一个地方一次性梭哈了的感觉
采集站群的方式,一个站一个分类,总能找到流量密码吧?
更大的还是没精力去天天修改编辑文章。想挂在那就不用管了。

朱悟能7758 发表于 2022-12-29 15:05:34

本帖最后由 朱悟能7758 于 2022-12-29 15:09 编辑

xu6882611 发表于 2022-12-29 12:37
我会java以及php,前端开发也还行,我的爬虫框架是基于selenium,于10月底研发完毕。
php使用laravel框架做w ...
你这个方法等同
1,写一个主站(用于控制和数据采集和分发)
2,子站,只需要添加接口推送过去即可。
3,子站用来显示,主站用来控制
4,这样的好处就是一个主站,只需要不停的去优化采集规则,不用操心子站的细节。
5,你的思路很牛,但与我情况不同,我是想最快达到目的,获得流量找到流量密码,找到变现确实可行的方法。
6,用啥系统和语言以及软件框架等都无所谓,达到目的即可。
7,如果我通过自写的软件来达到你这个主站的功能,我所使用的zblog做前台显示,其实跟你这个子站也是一个大概的意思。
8,最重要的地方还是内容方面,翻译与伪原创方面的提高。以及外链的建设。我之前说的开源cms是,是去找国外这种cms,找到他方便评论留言的接口,方便自己大批量去发送外链。

xu6882611 发表于 2022-12-29 15:42:39

朱悟能7758 发表于 2022-12-29 15:05
你这个方法等同
1,写一个主站(用于控制和数据采集和分发)
2,子站,只需要添加接口推送过去即可。


尽然是采集就先别考虑这些伪原创了,简单的伪原创并不科学。
单纯的采集也不行,还需要做分词关键词提取,相似文章推荐基于关键词匹配。
图片存储这块儿也要尽早落实。
把中文采集技术沉淀下来,然后逐步扩展到英文采集。
做大做强再创辉煌。

geili 发表于 2022-12-29 17:47:24

个人建议用python搞采集,python的scrapy框架搞采集非常方便。而且python跨平台,可以直接部署到linux的vps上通过cron定时运行。最重要的是python的库非常多,想要的功能直接网上就能找到相应的库,开发效率绝对比易语言高。
翻译github上也有python的谷歌翻译接口,直接拿来用。:D

选定好一个niche再进行采集,感觉现在采集站还是可以搞的,不要追求内容的数量,你的网站采集多了垃圾内容在谷歌眼里也成了垃圾站了,搜录全删光光。

网站程序直接用wordpress,毕竟是wordpress全世界使用最多的cms,很多坑都别人踩过了,遇到问题也好解决。或者直接用hexo、hugo等直接生成静态网站。

前期资金紧张,可以用国外的免费图床,HTTP抓包后自己写接口上传图片。后期发现网站流量不错,再把图片本地化。有的图床有反盗链,自己进行反代,简单可以用 https://wsrv.nl/?url= 代理访问,不行的自己写个接口伪造来路、user-agent后大部分都可以访问。

我就是搞的那种小型的采集站,以后准备继续扩大规模,展示下我的采集站, 这是最多的一个每天2000多ip:

纯纯的采集,文章也就几千篇,爬虫放在vps上定时任务去采。



采集后调用谷歌翻译整的英文垃圾站,内容不到5000,平均每天100多ip,就整了一个翻译的站,感觉批量搞搞应该还行,以后在整。

爬虫全部署到vps定时采集,网站基本每天更新,总之一切都要全自动,以后才能批量搞!:lol:lol:lol

tacoloco 发表于 2022-12-29 20:49:15

感谢分享:loveliness:

朱悟能7758 发表于 2022-12-29 22:27:29

geili 发表于 2022-12-29 17:47
个人建议用python搞采集,python的scrapy框架搞采集非常方便。而且python跨平台,可以直接部署到linux的vps ...

你的思路清晰,非常好,给我很大的参考意见。我一步步来。不急。。

newcb 发表于 2022-12-29 22:51:59

geili 发表于 2022-12-29 17:47
个人建议用python搞采集,python的scrapy框架搞采集非常方便。而且python跨平台,可以直接部署到linux的vps ...

流量还是很可以的吗?
页: [1] 2 3 4 5
查看完整版本: 做站记录贴,盈利或失败就结贴