zghz 发表于 2013-5-5 22:37:45

请问火车头怎么采集这样的内容

我打算用火车头采集联盟商品,其中一项需要采集的数据是推广链接,但是这个链接是不显示在网页的html源码中的,要获得推广链接需要点击一个“立即推广”按钮(对应html代码如下),随后弹出一个窗口,推广链接就显示在这个窗口里面。

<a class="btn btn-blue get-code" href="#" target="_blank" auctionid="23710452535">立即推广</a>
请问这段代码中的auctionid="23710452535" 是否是供js用的数据?

我用http抓包工具观察,当点击“立即推广”按钮时没有产生http请求,是否可以以此判断弹出窗口中显示的链接数据在访问网页的时候就已经载到本地了?如果是的话这样的数据如何采集呢?

不知道有没把问题描述清楚,有没懂的兄弟?


河小马 发表于 2013-5-5 23:02:31

你说的是对的

但是我不懂采集

zghz 发表于 2013-5-5 23:06:27

河小马 发表于 2013-5-5 23:02 static/image/common/back.gif
你说的是对的

但是我不懂采集

河马,这些链接数据已经存在本地了吗,一般在哪类文件中呢?

老猫 发表于 2013-5-5 23:37:36

如果点击后没有发现HTTP发包的话,去js里分析一下?

ROTOU 发表于 2013-5-5 23:39:51

JS动态生成的

ROTOU 发表于 2013-5-5 23:42:21

当页面加载的时候,JS已经为 “立即推广”的这个link绑定了事件,点击的时候,会触发对应的事件。

tudoutou 发表于 2013-5-5 23:53:06

换个思路,别想采集,看看是不是根据memberid和productid生成的

801023 发表于 2013-5-6 00:49:19

找js事件,这个应该是传的id,自己看js的算法,然后自己组合出链接

满意沟通 发表于 2013-5-6 02:17:18

自己把链接补齐..

item.taobao.com/item.htm?id=23710452535

阿百川 发表于 2013-5-6 08:07:38

看看要采集的数据,然后在已经下载到本地的文件中区搜索

zghz 发表于 2013-5-6 09:09:53

满意沟通 发表于 2013-5-6 02:17 static/image/common/back.gif
自己把链接补齐..

item.taobao.com/item.htm?id=23710452535

大哥你好犀利~!

sdwzzx 发表于 2013-5-6 09:14:43

自己补齐其实也不是不可以,不管怎么样,相信总归会有规律可循的

abcwuwuwu 发表于 2013-5-6 10:42:37

给个链接看看呗

herodfb 发表于 2013-5-6 11:05:41

采集必死,C大说的

prition 发表于 2013-5-6 13:56:21

传参~~:P
页: [1] 2
查看完整版本: 请问火车头怎么采集这样的内容