Mac上最良心的OCR工具,一行命令搞定图片提文字!

昨天帮朋友整理一堆扫描合同,几十页PDF要提取里面的文字。他跟我说:”Mac上没好用的OCR工具,只能一个个截图去网上转。”我听完直接笑了——兄弟,你怕是不认识mac-ocr这个玩意儿。

mac-ocr命令行OCR工具演示

这工具有啥用

说白了就是一个命令行OCR。扔张图片进去,文字直接蹦到终端上。但它的本事不止于此。

批量处理支持通配符,一次丢几十张图进去,挨个识别不带停的。PDF也行,多页文档逐页解析,还能用JSON流式输出,不用傻等整份文件跑完。还有个骚操作——直接给扫描件叠一层隐形文字,外观不变,但能选中能搜索能复制,说白了就是生成可搜索PDF。

甚至能直接填个网络图片URL,它自己下载识别,省得你先手动保存。

怎么装

npm全局安装一行搞定,或者npx免安装直接跑。要求macOS 10.15以上,不用装Xcode工具链。调用的是苹果自家的Vision框架,图片和文件不会传到任何地方,全在本地搞定,隐私这块拿捏的死死的。

说到这儿你可能想问,这玩意儿能不能给AI用?还真行。它自带agent skill,AI助手可以直接调用,省掉了vision token的开销。对于搞AI开发的朋友来说,这个小细节属实贴心。

缺点也得说

只支侍macOS,Windows和Linux用户看不了。而且识别质量完全取决于苹果Vision框架的上限,碰到手写体或者特别模糊的文字就有点拉胯了。不过截图、扫描件、发票这类场景,准确率已经相当够用。

就这一个小工具,装完往那一放,啥时候需要啥时候用。你Mac上不会还在用网页版OCR吧?

下载链接:https://pan.quark.cn/s/ccefa43beb50

分享github精选项目,AI最新的消息资讯和使用教程技巧
52软件资源库 » Mac上最良心的OCR工具,一行命令搞定图片提文字!