|

楼主 |
发表于 2020-10-2 23:20:06
|
显示全部楼层
东方人 发表于 2020-10-2 22:44
$ g# c, F; o/ @* `' ^* S* y, ~3 n现在硬盘那么便宜。, ^& z8 T W+ @
说说我的方法吧,买个德国VPS,然后采集英语,入库。
$ _& C, V5 J }5 N" D8 t, s% Z+ c再翻译成德语,法语,西班牙语, ...
0 H2 Z f; @" R( x* n抱歉,资质愚钝没太明白。
3 c" e& u5 d/ }- T% ~, G1 o8 R6 n采集入库后怎么翻译? “放入不同字段。然后搞个火车头免登陆接口发布”也没明白
9 G9 q+ O8 ^8 p另外火车头采集千万数据的话采集排重是不是比较困难,采集也可能比较慢。4 k# }1 H* w+ u* A, ]% P
我是想学下scrapy分布式抓取用布隆过滤器。 |
|