是一个关键词,提取目标网页的10W个URL?
是 这好象做不到,显示可能十几、几十万搜索结果,实际用工具的话,最多可能几十页就没东西了。 ipv6 :lol:lol 只有一个关键词搜索十万条URL是不可能的。
要用到批量的关键词和软件必须能解决验证码的问题才行。
相关软件: scrapebox / gscraper yoo 发表于 2013-6-4 13:30 static/image/common/back.gif
我以前曾经编过一个程序,从Google的搜索结果里提取网址。
因为GG搜索结果有着一定的规律,这些URL在包含在 ...
多线程+GAE代理
你懂得~ scrapebox 单线程, 多线程就会触发验证码了 :D 。。。。已经有人解答了 loquat 发表于 2013-6-5 12:28 static/image/common/back.gif
scrapebox 单线程, 多线程就会触发验证码了
sb多线程+代理,100w无压力 阿百川 发表于 2013-6-5 15:37 static/image/common/back.gif
sb多线程+代理,100w无压力
兄弟,你用的是收费的代理吗? 搜刮的免费代理,一会儿就被封了。 另外一个关键词 应该搜索不到100W数据吧 loquat 发表于 2013-6-5 21:08 static/image/common/back.gif
兄弟,你用的是收费的代理吗? 搜刮的免费代理,一会儿就被封了。 另外一个关键词 应该搜索不到100W数据 ...
免费的就可以,最好使用vps
一个关键词最多1000,这是gg的限制,但可以通过使用相似的关键词来搜刮 lhelhm 发表于 2013-6-4 13:26
Scrape Sonic
GetFromGoogle
这些小软件都可以,下不到你也可以搜索谷歌搜刮工具,火狐有个插件好久不用也忘 ...
这些小软件现在都下载不到了呢。
页:
1
[2]