从Google爬了点数据搞了个PDF下载站
原理我上一个帖子说过了,就是通过关键词爬取Google的搜索页面。由于是PDF下载站,所以只爬取了PDF的搜索结果,爬了大概120万页数据。然后就是把PDF文档转成图片,这个工作量比较大,CPU一直100%运行。基本原理就这些,刚搞的新站也没流量,贴出来大家看看,https://www.zoompdf.com
后面的工作就是搞流量,小伙伴们多提提建议,欢迎小伙伴找我吹牛。
本帖最后由 fs8908336 于 2019-3-22 12:44 编辑
osun 发表于 2019-3-21 20:37
兄弟,能不能给点做外链的思路啊
给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网站上的PDF内容有关。这样获得的外链是nofollow的,但是带来的是有效流量。
另外一个是steemit.com,发表一个全是外链的文章,然后找steemit robot花钱买点赞,凑够10 SBD就可以了,这个可以直接拿到dofollow的外链,而且steemit.com全球排名很高,大概一千名左右,这个拿来提高pr还是可以的,但是带来不了多少流量 Toogle 发表于 2019-3-21 10:28
文件都是哪来的?没有版权问题吗?
http://www.advertcn.com/thread-83068-1-1.html
文件都是从Google搜索结果里获取的,没有版权问题 牛逼牛逼。
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧
稍微做点外链,估计流量哗哗的 文件都是哪来的?没有版权问题吗?
http://www.advertcn.com/thread-83068-1-1.html
看这个帖子里提及的网站,好像就是因为版权问题被国外声讨,google一下就有了。.com可能被迫关了??现在是.net指向.org域名……
关注+学习……
能给点流量! 本帖最后由 qiqinjun 于 2019-3-21 13:09 编辑
这个站可以的,好好搞,但是最好是网站和数据,图片,文件这些分开存放,投诉肯定会有的,但是流量还算有点值钱的哦 osun 发表于 2019-3-21 12:07
文件都是从Google搜索结果里获取的,没有版权问题
Google获取的,并不代表没有版权问题吧?
你拿来了,从你的网站下载,不会有版权问题?
不懂,学习…… Toogle 发表于 2019-3-21 17:11
Google获取的,并不代表没有版权问题吧?
你拿来了,从你的网站下载,不会有版权问题?
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投诉就删除 osun 发表于 2019-3-21 18:08
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投 ...
了解……
域名不错,帮顶!! fs8908336 发表于 2019-3-21 20:29
牛逼牛逼。
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧
稍微做点外链,估计流量哗哗的 ...
兄弟,能不能给点做外链的思路啊 fs8908336 发表于 2019-3-21 20:43
给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...
多谢了兄弟,我来试试这两个方法 fs8908336 发表于 2019-3-21 20:43
给你两个我测试过的办法:
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...
开玩笑吧,找了一批人quora上写软文一点用都没有 然后我准备写个spider来爬你的站,连convert pdf 都省了。;P;P;P;P;P 国外这个肯定侵权,看别人投不投诉了,敢放adsense账号试试:lol