AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利广告开户独立站⚡️开户投放
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB二三解0.1元一个虚拟卡|PTM星际卡FB专用虚拟卡Google、Bing官方总代  联盟流量开户
FB账号资源/稳定靠谱/运行5年啦FB开户代投/三不限/白名单广告位出租 
查看: 12136|回复: 8

[讨论] 不能采集亚马逊?

[复制链接]

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
发表于 2015-11-3 05:51:27 | 显示全部楼层 |阅读模式
今天和一个朋友说起采集亚马逊,朋友说亚马逊不允许,我看了亚马逊联盟的说明,没有看到这一条啊8 s4 P0 L2 r6 t& G/ y
有经验的前辈怎么看?
; ^( t4 V6 n9 t! o: d! t* _2 N6 m, M! h, l
相关帖子
回复

使用道具 举报

2

主题

531

广告币

643

积分

中级会员

Rank: 3Rank: 3

积分
643

社区QQ达人

发表于 2015-11-3 09:26:06 | 显示全部楼层
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-3 13:45:52 | 显示全部楼层
什么叫不允许?& }' \4 E8 n  N
我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题。当然会有一些反爬虫的障碍。你说的不能采集的具体是指什么?

点评

我的意思是采集亚马逊做垃圾站,朋友说会被k 前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码 有别的思路吗?  详情 回复 发表于 2015-11-4 01:54
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-4 01:54:38 | 显示全部楼层
dersu 发表于 2015-11-3 13:45# \+ K) {( C& K* |0 ?( f+ k
什么叫不允许?5 D3 t' u5 S, K0 y
我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题 ...

2 U$ l& F) {2 H我的意思是采集亚马逊做垃圾站,朋友说会被k
5 ]) [+ r1 \8 r8 A6 e) R& B前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码1 m# l2 A0 u% Z% C: w+ W  C
有别的思路吗?

点评

量不大的话,楼下 @阿百川 兄弟说的是正解 否则你肯定会碰上RobotCheck,或者0或空字段 但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的 我这边因为同时为客户跑非常多的爬虫,常规有一个大概2  详情 回复 发表于 2015-11-4 16:52
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
发表于 2015-11-4 10:31:56 | 显示全部楼层
feego 发表于 2015-11-4 01:54
. B) e* r' z/ z8 [! l$ a. f我的意思是采集亚马逊做垃圾站,朋友说会被k6 h' W: ]4 d! k2 J( y
前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...
6 G' |$ b; Q/ J5 G0 H( ?
amazon有api,不用自己去采集

点评

亚马逊本身的api限制太多,对我来说基本无用  详情 回复 发表于 2015-11-5 03:39
回复 支持 反对

使用道具 举报

2

主题

1360

广告币

1722

积分

高级会员

Rank: 4

积分
1722

社区QQ达人

发表于 2015-11-4 10:36:49 | 显示全部楼层
把amazon的sitemap下载下来,然后通过里面的product url进行采集相关的数据
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-4 16:52:59 | 显示全部楼层
feego 发表于 2015-11-4 01:54) E9 p: @9 {- J9 t! q5 a
我的意思是采集亚马逊做垃圾站,朋友说会被k
1 G- s+ v! x5 y' p" |+ }2 \3 {$ V3 L前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...

3 S) b1 L; M  }  D% w% R量不大的话,楼下 @阿百川 兄弟说的是正解
3 a: S9 U$ x( W3 q: b( Q否则你肯定会碰上RobotCheck,或者0或空字段
; I# A/ j: Y- k% ?& e  F2 \; [* S但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的
8 j: y' s9 u  h! a8 z, ]8 K' `
9 @) g, I/ E  _: D我这边因为同时为客户跑非常多的爬虫,常规有一个大概2万的匿名代理池,一般有客户要爬东西,直接先上代理池大并发,如果不行再仔细研究网站和其他方法,如果每一个网站都仔细研究他们反爬技术的话,会累死的,呵呵
" Q1 V/ y6 {0 w* u9 [0 g; N# J0 q' w" ?' |* m
@李小冲 说的方法如果你没试过也一定要试一下,能减少很大工作量
( ]( W  `2 A9 O- h9 t8 Z
' C* O9 R9 T0 j* ^) V* g) M通常来说,爬一个网站之前,先看这三点:有没有API, 有没有Mobile站,有没有sitemap,吃过无数次亏的血泪经验,哈

点评

多谢~~~~~~~~~~~~~~~~  详情 回复 发表于 2015-11-5 03:42
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:39:11 来自手机 | 显示全部楼层
阿百川 发表于 2015-11-4 10:31
- K$ k# O0 }+ W0 iamazon有api,不用自己去采集

2 x. |7 g8 n7 r! A亚马逊本身的api限制太多,对我来说基本无用
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:42:42 来自手机 | 显示全部楼层
dersu 发表于 2015-11-4 16:522 F5 g8 u8 Y( ^, Q! A
量不大的话,楼下 @阿百川 兄弟说的是正解
% V5 C4 u  ^! r) O3 g" [否则你肯定会碰上RobotCheck,或者0或空字段
; V: T  |7 [/ Z6 a但API的限制我没 ...
$ ?+ o- @& w6 x/ w
多谢~~~~~~~~~~~~~~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-11-15 11:15 , Processed in 0.054986 second(s), 16 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表