AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

AdsEmpire
 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
【广户】
⚡️我们很有实力Search feed套利⚡️Affiliate 广告开户FB/Google/TK点我开户⚡️
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理全球虚拟卡, 支持U充值Facebook 批量上广告
尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)2024做什么 - Media buy 项目库各种主页、账单户、BM户(优势)
⚡️个人户,bm户不限额,账单户Adsterra 的CPA/CPM/CPC 网站流量一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB顶级服务商IPCola原生住宅IP⚡️$2.1/条双ISPFB1拖7/8/9一个也是批发价FB二三解0.1元一个
Google、Bing官方总代  联盟流量开户广告位出租  
查看: 12806|回复: 11

[讨论] 现在采集用什么软件?

[复制链接]

82

主题

630

广告币

1183

积分

中级会员

Rank: 3Rank: 3

积分
1183

社区QQ达人

发表于 2016-4-1 11:13:23 | 显示全部楼层 |阅读模式
adsterra
WordPress博客,想手动采集一部分,文字、图片、链接之类的,采集好之后直接发布,有什么采集软件或者采集脚本吗?
( L" H1 U) r1 m3 H+ U0 B  E* W! Zwprobot这个玩意儿好不好用?
- v& I2 U6 H+ F: q4 Y
3 u) L2 j# R( i
相关帖子
回复

使用道具 举报

3

主题

863

广告币

1902

积分

高级会员

Rank: 4

积分
1902

社区QQ达人

发表于 2016-4-1 11:33:24 | 显示全部楼层
火车头   

点评

谢谢回复! 火车头是不是必须要买收费版本的? 另外火车头可以直接写到WordPress数据库吗?  详情 回复 发表于 2016-4-1 11:44
回复 支持 反对

使用道具 举报

82

主题

630

广告币

1183

积分

中级会员

Rank: 3Rank: 3

积分
1183

社区QQ达人

 楼主| 发表于 2016-4-1 11:44:12 | 显示全部楼层
yinliang 发表于 2016-4-1 11:338 o, g0 j' y! D3 S* e9 O4 Q% J
火车头

7 t% c  A" c/ K# d, M5 w谢谢回复!
) C! M+ E5 C# R6 A. ]火车头是不是必须要买收费版本的?
/ i# f$ W5 b- V  T  R7 r4 ^5 [另外火车头可以直接写到WordPress数据库吗?8 b2 y& L4 r  @- i

点评

有破解版本的,另外,写数据库,这个是我自己写的脚本,你看有没有其它方法  详情 回复 发表于 2016-4-1 11:47
回复 支持 反对

使用道具 举报

3

主题

863

广告币

1902

积分

高级会员

Rank: 4

积分
1902

社区QQ达人

发表于 2016-4-1 11:47:14 | 显示全部楼层
gresh 发表于 2016-4-1 11:44$ C% y) K* r0 C8 l% |' \
谢谢回复!  R& ]1 I- ^6 K! G' v: m
火车头是不是必须要买收费版本的?
0 n: D2 P& N6 n, {另外火车头可以直接写到WordPress数据库吗?
/ v1 A# g3 a* }6 s% R" p
有破解版本的,另外,写数据库,这个是我自己写的脚本,你看有没有其它方法

点评

自己写!太厉害了,不知道这个脚本网上有没有什么教程,或者如何编写的资料可以参考?  详情 回复 发表于 2016-4-1 12:52
回复 支持 反对

使用道具 举报

82

主题

630

广告币

1183

积分

中级会员

Rank: 3Rank: 3

积分
1183

社区QQ达人

 楼主| 发表于 2016-4-1 12:52:26 | 显示全部楼层
yinliang 发表于 2016-4-1 11:478 z0 b; {! F/ K" [5 e& }! r
有破解版本的,另外,写数据库,这个是我自己写的脚本,你看有没有其它方法 ...
) z3 i/ c+ c8 X& r) N2 n, ^; B% a" G
自己写!太厉害了,不知道这个脚本网上有没有什么教程,或者如何编写的资料可以参考?
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
发表于 2016-4-1 13:16:04 | 显示全部楼层
gresh 发表于 2016-4-1 12:52- H; ^. X* O7 c
自己写!太厉害了,不知道这个脚本网上有没有什么教程,或者如何编写的资料可以参考? ...

8 v$ \! W0 W( W7 _* A可以参考火车头的wp免登陆接口,调用wp自身的发布函数,效率很高
回复 支持 反对

使用道具 举报

82

主题

630

广告币

1183

积分

中级会员

Rank: 3Rank: 3

积分
1183

社区QQ达人

 楼主| 发表于 2016-4-1 14:32:54 | 显示全部楼层
阿百川 发表于 2016-4-1 13:167 u; D2 X8 ?2 v- @* b
可以参考火车头的wp免登陆接口,调用wp自身的发布函数,效率很高
2 i# {8 Z4 S# A6 @- z
非常感谢,我去找一下
回复 支持 反对

使用道具 举报

103

主题

1819

广告币

2699

积分

高级会员

Rank: 4

积分
2699

社区QQ达人

发表于 2016-4-1 17:06:28 | 显示全部楼层
gresh 发表于 2016-4-1 14:32
4 R5 d; O  I, @( R' u( c/ V: L# p6 n非常感谢,我去找一下

7 ]9 X3 B5 q% a  r. E/ f. P淘宝上几块钱就能解决& U- L: K" V3 K/ l/ z  n
火车头是无论如何得学会使用的,学会火车头其他任何采集软件基本手到擒拿!
回复 支持 反对

使用道具 举报

18

主题

499

广告币

765

积分

中级会员

Rank: 3Rank: 3

积分
765

社区QQ达人

发表于 2016-4-1 19:20:38 | 显示全部楼层
wordpress发布模块
8 h" t- y9 e" y; R: i, z4 B- {在網上求的,沒測試能否使用
8 f& z4 R, A# [5 _* k/ fhttp://pan.baidu.com/s/1ge6Bg8j
回复 支持 反对

使用道具 举报

82

主题

630

广告币

1183

积分

中级会员

Rank: 3Rank: 3

积分
1183

社区QQ达人

 楼主| 发表于 2016-4-1 20:58:04 | 显示全部楼层
kc0203 发表于 2016-4-1 19:204 q" [' U( l$ ^- x/ V# f
wordpress发布模块
5 j2 Z1 [: s! \! _' v4 }2 O在網上求的,沒測試能否使用6 }% L# _4 F2 X* s9 k
http://pan.baidu.com/s/1ge6Bg8j
* W( j; l, O5 {* ?
非常感谢,我在火车头论坛也看到很多插件,我先试试看!
回复 支持 反对

使用道具 举报

0

主题

7

广告币

17

积分

新手上路

Rank: 1

积分
17
发表于 2016-5-3 16:43:52 | 显示全部楼层
看自身需求,火车头有能采集的,也有不能采集的,还需要自己写规则,必然要懂点程序,不会的话,可以试试八爪鱼,话说都是收费的。
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2016-5-3 17:22:28 | 显示全部楼层
我这边公司主业之一是帮人抓数据,我并不是要在这推广我们公司业务,只是提点小建议:5 b0 h' k8 F( q' d
1. 简单网站的话,用火车头八爪鱼之类的,比较好。简单不简单的判断在于,页面数量,是否更新频率非常高,是否需要分布式抓取,是否ajax网站,对方反爬机制是否很强大。比如说,你打算抓点新闻或者一些博客这种量级的需求,那桌面小软件还是可以的。
* q# v# T# Q' S' E6 r2. 火车头的好处并不是抓取本身,而是有很多的再发布模块可用,这个确实很省事。如果不考虑发布模块,那其实很多免费的软件可用,包括一些是全可视化操作的,非常方便
5 Y7 h7 T2 F. o: L* `9 q4 f8 D" u3. 如果你需要抓取的源网站逻辑比较复杂,而且你的时间成本还比较高的话,那你还是上淘宝找个人帮你做好火车头的规则把,如你时间成本高,那性价比还是不错的
2 O4 Q! v1 s+ g) U1 o# z& g4. 对于那些逻辑复杂且极强反爬策略的,那还是考虑换个数据源把,自己做,花大量时间还不见得能成功抓取,如果找别人抓取,那成本也不低
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-9-22 14:27 , Processed in 0.061482 second(s), 21 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表