osun 发表于 2019-3-21 09:24:34

从Google爬了点数据搞了个PDF下载站

原理我上一个帖子说过了,就是通过关键词爬取Google的搜索页面。由于是PDF下载站,所以只爬取了PDF的搜索结果,爬了大概120万页数据。然后就是把PDF文档转成图片,这个工作量比较大,CPU一直100%运行。

基本原理就这些,刚搞的新站也没流量,贴出来大家看看,https://www.zoompdf.com

后面的工作就是搞流量,小伙伴们多提提建议,欢迎小伙伴找我吹牛。

fs8908336 发表于 2019-3-21 20:43:58

本帖最后由 fs8908336 于 2019-3-22 12:44 编辑

osun 发表于 2019-3-21 20:37
兄弟,能不能给点做外链的思路啊

给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网站上的PDF内容有关。这样获得的外链是nofollow的,但是带来的是有效流量。
另外一个是steemit.com,发表一个全是外链的文章,然后找steemit robot花钱买点赞,凑够10 SBD就可以了,这个可以直接拿到dofollow的外链,而且steemit.com全球排名很高,大概一千名左右,这个拿来提高pr还是可以的,但是带来不了多少流量

osun 发表于 2019-3-21 12:07:56

Toogle 发表于 2019-3-21 10:28
文件都是哪来的?没有版权问题吗?

http://www.advertcn.com/thread-83068-1-1.html


文件都是从Google搜索结果里获取的,没有版权问题

fs8908336 发表于 2019-3-21 20:29:56

牛逼牛逼。
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧
稍微做点外链,估计流量哗哗的

Toogle 发表于 2019-3-21 10:28:52

文件都是哪来的?没有版权问题吗?

http://www.advertcn.com/thread-83068-1-1.html

看这个帖子里提及的网站,好像就是因为版权问题被国外声讨,google一下就有了。.com可能被迫关了??现在是.net指向.org域名……

关注+学习……

8943 发表于 2019-3-21 10:33:52

能给点流量!

qiqinjun 发表于 2019-3-21 13:07:37

本帖最后由 qiqinjun 于 2019-3-21 13:09 编辑

这个站可以的,好好搞,但是最好是网站和数据,图片,文件这些分开存放,投诉肯定会有的,但是流量还算有点值钱的哦

Toogle 发表于 2019-3-21 17:11:19

osun 发表于 2019-3-21 12:07
文件都是从Google搜索结果里获取的,没有版权问题

Google获取的,并不代表没有版权问题吧?

你拿来了,从你的网站下载,不会有版权问题?

不懂,学习……

osun 发表于 2019-3-21 18:08:03

Toogle 发表于 2019-3-21 17:11
Google获取的,并不代表没有版权问题吧?

你拿来了,从你的网站下载,不会有版权问题?


公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投诉就删除

Toogle 发表于 2019-3-21 18:18:26

osun 发表于 2019-3-21 18:08
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投 ...

了解……

域名不错,帮顶!!

osun 发表于 2019-3-21 20:37:13

fs8908336 发表于 2019-3-21 20:29
牛逼牛逼。
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧
稍微做点外链,估计流量哗哗的 ...

兄弟,能不能给点做外链的思路啊

osun 发表于 2019-3-21 22:13:39

fs8908336 发表于 2019-3-21 20:43
给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...

多谢了兄弟,我来试试这两个方法

augustwu 发表于 2019-3-21 22:34:57

fs8908336 发表于 2019-3-21 20:43
给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...

开玩笑吧,找了一批人quora上写软文一点用都没有

我是c罗 发表于 2019-3-21 23:24:25

然后我准备写个spider来爬你的站,连convert pdf 都省了。;P;P;P;P;P

紫气东来GG 发表于 2019-3-21 23:51:19

国外这个肯定侵权,看别人投不投诉了,敢放adsense账号试试:lol
页: [1] 2 3
查看完整版本: 从Google爬了点数据搞了个PDF下载站