AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利广告开户独立站⚡️开户投放
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB二三解0.1元一个虚拟卡|PTM星际卡FB专用虚拟卡Google、Bing官方总代  联盟流量开户
FB账号资源/稳定靠谱/运行5年啦FB开户代投/三不限/白名单广告位出租 
查看: 6401|回复: 6

利用文字识别批量去除文字类型水印。

[复制链接]

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
发表于 2018-8-28 13:18:00 | 显示全部楼层 |阅读模式
本帖最后由 xiaoxue 于 2019-3-4 20:49 编辑

简单点的思路 。
图像转换jpg -> post 到 baiduAi -> 返回识别的文字(带坐标)-> 根据返回的坐标Image.new() 生成个#FFfff背景的图像->利用Image.paste() 把#fff图像覆盖住水印
  1. # -*- coding: utf-8 -*-
  2. from aip import AipOcr
  3. import time
  4. import random
  5. import sys,re
  6. import requests,json
  7. from PIL import Image, ImageDraw,ImageFont
  8. import base64
  9. # """ 你的 APPID AK SK """
  10. APP_ID = xxx'
  11. API_KEY = 'xxxx'
  12. SECRET_KEY = 'xxxxx'
  13. client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
  14. a = client.accurate(image)
  15. def get_file_content(filePath):
  16. with open(filePath, 'rb') as fp:
  17. return fp.read()
  18. def Wordfilter(words, arr):
  19.         for str in arr:
  20.                 if words.find(str) >=0:
  21.                         return True
  22.         return False
  23. for juzi in a['data']['words_result']:
  24.         filterKey = [‘股票学习网','股票','股票学习','股票学','习网','www.']
  25.         if Wordfilter(juzi['words'],filterKey):
  26.                 cropZB = juzi['location']
  27.                 left = cropZB['left']
  28.                 top = cropZB['top']
  29.                 right = left + cropZB['width']
  30.                 bottom = top + cropZB['height']
  31.                 TC_img = Image.new("RGB",(cropZB['width'],cropZB['height']),"#FFFFFF")
  32.                 im.paste(TC_img,(left, top, right, bottom))
  33.         
  34. im.save(file)
复制代码

处理前:

处理后:


一些小技巧:
im.resize((w*2, h*2),Image.ANTIALIAS)
im.resize((w*3, h*3),Image.ANTIALIAS)
im.resize((w*4, h*4),Image.ANTIALIAS)
通过修改 宽和高: 来提高 文字识别的准确率度。
处理完后im.resize((w, h),Image.ANTIALIAS).save('xx.jpg')

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

评分

参与人数 1广告币 +8 收起 理由
saveascj + 8 不懂代码,但纯支持。

查看全部评分

相关帖子
回复

使用道具 举报

2

主题

169

广告币

424

积分

中级会员

Rank: 3Rank: 3

积分
424
发表于 2018-8-30 09:19:04 | 显示全部楼层
现在已经进入 ai niche 站时代了,楼主有什么好玩的吗, 我在做采集翻译语音自动上传youtb一条龙的自动化站
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-8-30 14:53:01 来自手机 | 显示全部楼层
好玩的? 最近研采集  用百度ai做文章分类 tag 内链 去水印啥的。 youtube不审了 没得搞吧。
回复 支持 反对

使用道具 举报

3

主题

31

广告币

157

积分

初级会员

Rank: 2

积分
157

社区QQ达人

发表于 2018-9-15 23:19:50 | 显示全部楼层
楼主发的好玩啊

点评

多交流~ 紫薯补丁  详情 回复 发表于 2018-9-20 21:27
各种数据。
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-9-20 21:27:17 来自手机 | 显示全部楼层
blockmoon 发表于 2018-9-15 23:19
楼主发的好玩啊

多交流~ 紫薯补丁
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-9-20 21:28:11 来自手机 | 显示全部楼层
facebook号专家 发表于 2018-9-19 09:03
楼主 漏脸了。。。哈哈

? fb小号咋卖的。
回复 支持 反对

使用道具 举报

直行转左 该用户已被删除
发表于 2018-9-30 00:39:23 | 显示全部楼层
最近也在搞采集翻译建站,用翻译出来可读性一般
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-11-15 04:05 , Processed in 0.050972 second(s), 19 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表