有几个规则不好处理,如果加上了效率反而比while还低
有点疑惑,同一产品页面每次request会有不同的模板?好像没遇到过。
如果同一产品页面每次request有不同模板,while效率要比轮询规则高(总有一次会while到那个模板);如果同一页面每次request都是一个模板,则可以默认为A规则,采集到了就不轮询,采集不到就换其他规则。做得更智能的话,可以程序动态调整默认规则,提高效率。 joul 发表于 2013-5-16 16:21 static/image/common/back.gif
有点疑惑,同一产品页面每次request会有不同的模板?好像没遇到过。
如果同一产品页面每次request有不同 ...
嗯,同产品,同request,就测试出了三种模板,第三种模板太麻烦就改用while了,目前测试了几千条数据,while最多不超过10次
阿百川 发表于 2013-5-16 16:41 static/image/common/back.gif
嗯,同产品,同request,就测试出了三种模板,第三种模板太麻烦就改用while了,目前测试了几千条数据,wh ...
学习了!这样的话,只能用while保险了,只是效率慢了些。 joul 发表于 2013-5-16 16:46 static/image/common/back.gif
学习了!这样的话,只能用while保险了,只是效率慢了些。
开多线程,速度勉强还可以 amazon这种活跃的网站肯定经常改版啊,你只能跟着变,可以写一个监控amazon模板变化的程序,一旦模板变了就跟进吧
页:
1
[2]