AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

Binom
 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利广告开户独立站⚡️开户投放
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB二三解0.1元一个虚拟卡|PTM星际卡FB专用虚拟卡Google、Bing官方总代  联盟流量开户
FB账号资源/稳定靠谱/运行5年啦FB开户代投/三不限/白名单fb耐用号0.01一个fb账号官方合作商
广告位出租   
查看: 36044|回复: 35

[讨论] 从Google爬了点数据搞了个PDF下载站

[复制链接]

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
发表于 2019-3-21 09:24:34 | 显示全部楼层 |阅读模式
原理我上一个帖子说过了,就是通过关键词爬取Google的搜索页面。由于是PDF下载站,所以只爬取了PDF的搜索结果,爬了大概120万页数据。然后就是把PDF文档转成图片,这个工作量比较大,CPU一直100%运行。
  d% s# q8 _& E  x
2 ^  M. J: G! S3 |基本原理就这些,刚搞的新站也没流量,贴出来大家看看,https://www.zoompdf.com4 z) v0 b9 b# c: b9 t5 o

7 s1 u0 q3 x+ l+ k6 [5 y0 a8 v后面的工作就是搞流量,小伙伴们多提提建议,欢迎小伙伴找我吹牛。0 G6 i5 r& |% Y, P7 I2 R

! a+ p* d2 ^. h# H3 Z( ?
相关帖子
回复

使用道具 举报

36

主题

739

广告币

907

积分

中级会员

Rank: 3Rank: 3

积分
907

社区QQ达人

发表于 2019-3-21 20:43:58 | 显示全部楼层
本帖最后由 fs8908336 于 2019-3-22 12:44 编辑
/ ]2 K" t$ |4 `  w3 A2 q
osun 发表于 2019-3-21 20:37
! Z% ?% ~1 {" d  {. _兄弟,能不能给点做外链的思路啊

4 W( x, j' s4 w& B$ A9 q9 L' {% Y) i2 w5 j& C
给你两个我测试过的办法:' [$ l% T$ R( v. |- m! l
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网站上的PDF内容有关。这样获得的外链是nofollow的,但是带来的是有效流量。4 Z! J! `4 G, X$ l0 t  x
另外一个是steemit.com,发表一个全是外链的文章,然后找steemit robot花钱买点赞,凑够10 SBD就可以了,这个可以直接拿到dofollow的外链,而且steemit.com全球排名很高,大概一千名左右,这个拿来提高pr还是可以的,但是带来不了多少流量
回复 支持 2 反对 0

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 12:07:56 | 显示全部楼层
Toogle 发表于 2019-3-21 10:28
& U1 v8 @7 f# t* C+ D文件都是哪来的?没有版权问题吗?
+ I. i! @# F2 N5 R; R6 z! G+ O% A# Y: r2 Z2 G
http://www.advertcn.com/thread-83068-1-1.html
$ P* u0 n7 ^; a8 s: t5 @
文件都是从Google搜索结果里获取的,没有版权问题
回复 支持 1 反对 0

使用道具 举报

36

主题

739

广告币

907

积分

中级会员

Rank: 3Rank: 3

积分
907

社区QQ达人

发表于 2019-3-21 20:29:56 | 显示全部楼层
牛逼牛逼。
2 |1 M8 B0 [1 U& ~4 S& I3 ]看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧
3 y/ k1 A# B9 R8 |稍微做点外链,估计流量哗哗的
回复 支持 1 反对 0

使用道具 举报

84

主题

1571

广告币

3085

积分

高级会员

Rank: 4

积分
3085
发表于 2019-3-21 10:28:52 | 显示全部楼层
文件都是哪来的?没有版权问题吗?7 f/ X2 B# B6 q9 d0 w7 v
; O& ?; _5 u* L+ a; P  s& o
http://www.advertcn.com/thread-83068-1-1.html
/ C- j8 D. a$ b- A: u) B. t* n5 W" ]. c: W- x" s
看这个帖子里提及的网站,好像就是因为版权问题被国外声讨,google一下就有了。.com可能被迫关了??现在是.net指向.org域名……
& k1 g+ |- p) D3 r: J# }$ R' I4 N9 ~/ O; Q
关注+学习……/ S! a9 f6 C4 G
. G7 G8 r8 G) f' R
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

219

主题

1198

广告币

2242

积分

高级会员

Rank: 4

积分
2242
发表于 2019-3-21 10:33:52 来自手机 | 显示全部楼层
能给点流量!
回复 支持 反对

使用道具 举报

23

主题

1229

广告币

2177

积分

高级会员

Rank: 4

积分
2177

社区QQ达人

发表于 2019-3-21 13:07:37 | 显示全部楼层
本帖最后由 qiqinjun 于 2019-3-21 13:09 编辑
( e" t2 G7 L8 q6 D4 m0 u0 V  T8 V% l- }; F* S0 x, x3 X: m
这个站可以的,好好搞,但是最好是网站和数据,图片,文件这些分开存放,投诉肯定会有的,但是流量还算有点值钱的哦
回复 支持 反对

使用道具 举报

84

主题

1571

广告币

3085

积分

高级会员

Rank: 4

积分
3085
发表于 2019-3-21 17:11:19 | 显示全部楼层
osun 发表于 2019-3-21 12:07$ b/ l$ ?4 d- E5 b. Q
文件都是从Google搜索结果里获取的,没有版权问题

" t7 }  o/ V* {* dGoogle获取的,并不代表没有版权问题吧?
5 q) t7 Y, n7 C! J8 O) u' f7 t- x" n7 I. d. Y2 B1 E
你拿来了,从你的网站下载,不会有版权问题?! q' i' C" ^8 I, {1 r# j7 v1 r
: H' x" Y5 J; m9 K9 t6 g
不懂,学习……
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 18:08:03 | 显示全部楼层
Toogle 发表于 2019-3-21 17:11
$ P) _4 D/ S4 A" ]Google获取的,并不代表没有版权问题吧?
+ b  Z, O, d- s6 ]& R! Z" n- @6 d6 p! I+ O
你拿来了,从你的网站下载,不会有版权问题?
0 O3 W; ^$ N% r4 G* p9 P& c4 T
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投诉就删除
回复 支持 反对

使用道具 举报

84

主题

1571

广告币

3085

积分

高级会员

Rank: 4

积分
3085
发表于 2019-3-21 18:18:26 | 显示全部楼层
osun 发表于 2019-3-21 18:08, X; S2 d. ]+ q5 E& S5 _
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投 ...
( w. k* i  u3 Q! n, F& S+ x
了解……: k- H1 G4 d: V1 y) A  l
( \- e% m) [& y# [) Q5 k
域名不错,帮顶!!
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 20:37:13 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:295 R, o8 M5 s8 {* F1 @
牛逼牛逼。) V. f: Y, ^. r% Q4 D3 o7 b
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧) [6 `, g+ x. o6 M% t( w9 P
稍微做点外链,估计流量哗哗的 ...

, f# H( T: H& M! }7 N兄弟,能不能给点做外链的思路啊
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 22:13:39 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:437 k* {/ M: B# S: O2 W6 N' @/ L
给你两个我测试过的办法:5 f+ j- B1 l2 ~! \
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...
6 m% c. {$ Y7 ^* X9 @5 F
多谢了兄弟,我来试试这两个方法
回复 支持 反对

使用道具 举报

12

主题

487

广告币

1118

积分

中级会员

Rank: 3Rank: 3

积分
1118

社区QQ达人

发表于 2019-3-21 22:34:57 来自手机 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:43
  j* }& Q4 }& s给你两个我测试过的办法:7 H# ~5 c6 j# R( S  n5 J, ~5 d, u  J$ z
一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...

& p1 H5 n( K( a8 l开玩笑吧,找了一批人quora上写软文一点用都没有
回复 支持 反对

使用道具 举报

52

主题

739

广告币

1401

积分

高级会员

Rank: 4

积分
1401

社区QQ达人

发表于 2019-3-21 23:24:25 | 显示全部楼层
然后我准备写个spider来爬你的站,连convert pdf 都省了。
我是C罗!!!
回复 支持 反对

使用道具 举报

21

主题

1497

广告币

3051

积分

高级会员

Rank: 4

积分
3051
发表于 2019-3-21 23:51:19 | 显示全部楼层
国外这个肯定侵权,看别人投不投诉了,敢放adsense账号试试
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-11-23 19:54 , Processed in 0.050837 second(s), 16 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表