朝阳风雨 发表于 2022-4-28 15:12:08

hajiu530 发表于 2022-4-28 14:32
这类破解软件可以放adsense吗 我记得以前会有人投诉 然后就封了

可以放,不过我的也经常受到投诉,现在不是封号,会告诉你网站有违规内容,然后禁止在这个页面上投放广告。

freekj126 发表于 2022-4-28 16:57:03

朝阳风雨 发表于 2022-4-28 15:12
可以放,不过我的也经常受到投诉,现在不是封号,会告诉你网站有违规内容,然后禁止在这个页面上投放广告 ...

投诉多了会不会封网站呢??

朝阳风雨 发表于 2022-4-28 17:51:12

freekj126 发表于 2022-4-28 16:57
投诉多了会不会封网站呢??

不知道,目前没有封。

hajiu530 发表于 2022-4-29 13:00:15

朝阳风雨 发表于 2022-4-28 15:12
可以放,不过我的也经常受到投诉,现在不是封号,会告诉你网站有违规内容,然后禁止在这个页面上投放广告 ...

谢谢版主~

gresh 发表于 2022-5-8 07:35:42

本帖最后由 gresh 于 2022-5-8 07:41 编辑

请教一下,类似这种图文混排的文章,在采集的时候图如何处理才能保证图片和文字能够像原文一样正常显示?我原来是用火车头爬,截取正文头尾,然后用替换的方式处理图片链接及标签属性。
现在用python采集,按照火车头的方式来处理就非常麻烦,需要代码量非常大,请问你是如何处理此类问题的?

sead 发表于 2022-5-8 19:03:24

gresh 发表于 2022-5-8 07:35
请教一下,类似这种图文混排的文章,在采集的时候图如何处理才能保证图片和文字能够像原文一样正常显示?我 ...

一样显示就难了,采集时选同模版的:lol
另外图片处理建议做成给地址就能自动下载的,WP写个逻辑对源地址做个md5处理,推送这个md5和地址到图片服务器自动下载

gresh 发表于 2022-5-8 20:49:01

sead 发表于 2022-5-8 19:03
一样显示就难了,采集时选同模版的
另外图片处理建议做成给地址就能自动下载的,WP写个逻辑对源地址 ...

谢谢回复。选择同模板的就比较难了
我采集的网站基本都是wordpress的,每个站的样式都不同,方法不通用
另外,自动下载这个方法有没有关键词,我去搜索一下解决办法!

sead 发表于 2022-5-9 11:13:36

gresh 发表于 2022-5-8 20:49
谢谢回复。选择同模板的就比较难了
我采集的网站基本都是wordpress的,每个站的样式都不同,方法不通用
...

网址用md5跑一下就行了。
自动下载的服务器把网址入库用于保留下载源,md5作为索引文本。
页: 1 [2]
查看完整版本: 采集站图片是撸下来还是用代理转发?