昨晚帮同事转一段会议录音,折腾半天没搞定。后来翻到几个 GitHub 项目,用完直呼真香。今天分享三个,每个都拿得出手。

Vibe:离线语音转文字,告别网络依赖

这玩意基于 OpenAI Whisper 模型,断网也能跑。拖个音频文件进去,几分钟就出文字稿。

支持音频视频都能转,YouTube 链接直接丢进去也能转录。内置 GPU 加速,Nvidia、AMD、Intel 显卡都兼容。还能调 Claude API 生成摘要,废用手动整理笔记了。

不过界面全是英文,英文不好的朋友得摸索一阵。处理特别长的音频时,进度反馈不够直观,容易以为卡死了。

项目截图

Firecrawl:给 AI 应用喂数据,不用再手写爬虫

搞过爬虫的都知道,JS 渲染、反爬、代理切换能把人逼疯。Firecrawl 专门解决这些破事。

它能把网页直接转成干净的 Markdown 或结构化数据。整站爬取、批量抓取、LLM 结构化提取都支持。拿来给 RAG 应用喂数据,省事不少。还内置内容变更监控,适合做情报收集。

文档写得不够细,某些动态页面偶尔漏抓。免费额度有限,大规模使用还是得自己部暑。

项目截图

ConvertX:千种格式互转,告别野鸡转换网站

图片转 WebP、视频转 MP4、PDF 转 Word、电子书转 EPUB……一个 ConvertX 全包了。

支持超过一千种格式互转。部署在自己服务器上,数据不出内网。批量转换、密码保护、多用户管理都有。比起那些满屏广告的在线转换站,用着踏实多了。

首次配值得花点时间,冷门格式偶尔转换失败。对服务器硬件有一定要求,低配机器转大文件会比较慢。

项目截图

三个项目,一个转录、一个抓数据、一个转格式,凑一起干活效率直接拉满。你们平时还有什么私藏的 GitHub 项目,评论区不分享一下?