7

windows 平台 ocr 软件有什么好的选择

 1 year ago
source link: https://www.v2ex.com/t/936159
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  问与答

windows 平台 ocr 软件有什么好的选择

  busterian · 18 小时 25 分钟前 · 977 次点击

我现在用的是天若 ocr 调用百度的接口,速度还可以就是准确率差点。微信电脑版点开图片自带 ocr 准确率挺高的,v 友有什么好建议?

32 条回复    2023-04-29 05:18:24 +08:00
GuryYu

GuryYu      18 小时 15 分钟前

PowerToys 里面有个离线的 OCR 工具
freedgw

freedgw      18 小时 12 分钟前 via Android

白描,这个收费几块钱吧,但识别准确度很好;
然后 gitee 上还有一个天若 OCR 离线版,我之前用的比较多,应该也是够用的;
现在我主要用的 quicker ,里面有个 OCR 动作,但是这个软件功能太多了,单纯 OCR 的话可能不太推荐专门去下这个
mainjzb

mainjzb      18 小时 10 分钟前

PowerToys 里的 ORC 一言难尽,好像是调的 windows 系统级的 ORC 。目前看来是最拉跨的。被苹果和微信的 ORC 吊打
datocp

datocp      16 小时 38 分钟前

上次找了一个 汉王 PDF OCR ,似乎挺牛逼的,转换出来的是真正的 word 文档,不是图片。不知道跟原始的格式是否有关系。
daocyang

daocyang      16 小时 34 分钟前

微信电脑版的 ocr 识别目前用起来很顺手
idragonet

idragonet      16 小时 25 分钟前

@daocyang #5 微信电脑版算了,笔画多的字识别率一塌糊涂。
busterian

busterian      16 小时 19 分钟前

@idragonet 那你倒是说个能用的啊, 付费的也可
idragonet

idragonet      16 小时 7 分钟前

@busterian #7 QQ 截图是云识别,这个识别率高!
jacy

jacy      15 小时 34 分钟前

右键-打开方式-word
jack4in

jack4in      15 小时 18 分钟前

@busterian
paddleocr
dengqixun

dengqixun      15 小时 14 分钟前 via Android

@jacy word 识别字体变化多,格式复杂一点的文档错别字太多了
Yukiteru

Yukiteru      14 小时 54 分钟前 via Android

text-grab ,开源的,powertoys 的 orc 也是基于这个
djoiwhud

djoiwhud      14 小时 17 分钟前

一哥是毛子的 abbyy
XIU2

XIU2      14 小时 13 分钟前

翻了翻书签,找到了下面几个 OCR 相关的,你可以挨个试试(记得移除地址中的空格)。

这四个都是离线的 OCR 软件(最后一个是 天若 OCR 离线版):
https://github. com/xushengfeng/eSearch
https://github. com/hiroi-sora/Umi-OCR
https://github. com/xksoft/OcrHelper
https://gitee.com/wanglifree/tianruoocr-cl

这个我记得是论坛里人做的,虽然是个在线网站,但都是在浏览器端本地实现的 OCR:
https://ocr. zjyl1994. com

这个支持 OCR 但没说是离线还是在线的:
https://gitee. com/smartoldfish/ocr-assistant
sadfQED2

sadfQED2      14 小时 9 分钟前 via Android

免费,不要钱,安装方便且没广告,识别率还高的。只有 qq 微信
goodgame

goodgame      13 小时 53 分钟前

tesseract 怎么样?没怎么用过,有没有用过的大哥讲一下?
tutustream

tutustream      13 小时 49 分钟前

我买了迅捷 ocr 的会员
ungrown

ungrown      13 小时 30 分钟前   ❤️ 1

@goodgame #16 tesseract 本身挺好,但是用起来并不方便。这玩意性能不弱,架构不落后,功能接口丰富,背后也一直有大厂在推着它走。但是,喂给它的图像必须够清晰,换句话说,预处理这块,它不负责。排版、格式、方向的识别,也是,它不负责,虽然它也提供这方面的功能接口,但用户得自己构建前置处理的环节。总之,这东西,不是傻瓜化的开箱即用的解决方案。字符清晰、明暗统一、排列整齐的文本图片,它能给出让人满意的结果,否则的话,消化不良。
ungrown

ungrown      13 小时 19 分钟前

要么各种大厂的云端接口,免费或者付费,但说实话其实良莠不齐,各有短板。
你还可以试试 EasyOCR ,我玩过还行,不过跟 paddleocr 一样,基于机器学习,所以设备算力不能太弱。
或者就拿 tesseract 自己折腾。
abbyy 是绝对的独一档,不过不知道它有没有编程调用接口。

然后,提供个邪门,你知道漫画汉化这块吗,对 OCR 的需求很大。过去技术欠发展那也没人多寻思,都是汉化组手工修图、人肉翻译校对润色。但现在有了一整套自动化、半自动化方案,从图片预处理、去噪锐化拉伸、画面增强、角度扶正,到文字区识别、语言自动监测、多方 API 并行调用、格式排版自动识别,最后按照原图上的文本位置和排版自动将译文嵌入图中,用户只要手动选择、编辑、润色一下,讲真搞这玩意的那帮人虽然离第一梯队还有距离,但是完成度相当牛逼。社区驱动能做到这种程度,背后的需求肯定很大,搞不好成人色情漫画的汉化需求也是个大头。不过不是完全开源的,还收费,但如果能跟背后的团队联系上的话不妨去取取经。
ErikaGao

ErikaGao      13 小时 19 分钟前

RapidOCR ?自己本地起个服务就行,是 PaddleOCR 的模型导出版本 https://github.com/RapidAI/RapidOCR
shangyu7

shangyu7      11 小时 28 分钟前

Umi-OCR 离线版的,挺准确
Tan35haha

Tan35haha      9 小时 58 分钟前

白描? 用的还可以
n18255447846

n18255447846      8 小时 37 分钟前

@goodgame 中文识别不太行,不如百度 paddleocr
miaomiao888

miaomiao888      7 小时 52 分钟前

离线的基本都不好用,识别率不高,百度、腾讯、微信都一般,白描好像是基于有道,似乎比百度要稍好点。
可以试试 PandaOCR.Pro (这是个名字不是域名)激活后试试里面的合合 OCR 或火山 OCR (字节跳动)接口,识别质量都挺高,合合应该算是业界识别质量最好的,没人能打。
EngAPI

EngAPI      7 小时 26 分钟前

Umi-OCR 用的是飞桨,准确率还行
hammy

hammy      5 小时 56 分钟前

白描
QQ
微信

少量的话,虽然看起来滑稽但是 QQ 可能是最好用的。。。。
opengps

opengps      5 小时 47 分钟前

quicker 里添加了一个截图 ocr ,很方便
yuanix

yuanix      2 小时 55 分钟前 via Android

QQ 比 powertoy 好用,PDF 文件的话,Adobe reader 支持 ocr 。
imycc

imycc      27 分钟前

之前也想找个离线的 ocr ,找着找着发现微信跟飞书的截图都支持 ocr 了。。遂放弃
732870147

732870147      16 分钟前 via Android

在用 pearocr ,支持 PWA ,离线可用
https://pearocr.com/

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK