狂揽 68.8K 星!3 个 GitHub 开源项目,用过的人都说香!
昨晚帮同事转一段会议录音,折腾半天没搞定。后来翻到几个 GitHub 项目,用完直呼真香。今天分享三个,每个都拿得出手。
01 Vibe:离线语音转文字,告别网络依赖
这玩意基于 OpenAI Whisper 模型,断网也能跑。拖个音频文件进去,几分钟就出文字稿。
支持音频视频都能转,YouTube 链接直接丢进去也能转录。内置 GPU 加速,Nvidia、AMD、Intel 显卡都兼容。还能调 Claude API 生成摘要,废用手动整理笔记了。
不过界面全是英文,英文不好的朋友得摸索一阵。处理特别长的音频时,进度反馈不够直观,容易以为卡死了。

02 Firecrawl:给 AI 应用喂数据,不用再手写爬虫
搞过爬虫的都知道,JS 渲染、反爬、代理切换能把人逼疯。Firecrawl 专门解决这些破事。
它能把网页直接转成干净的 Markdown 或结构化数据。整站爬取、批量抓取、LLM 结构化提取都支持。拿来给 RAG 应用喂数据,省事不少。还内置内容变更监控,适合做情报收集。
文档写得不够细,某些动态页面偶尔漏抓。免费额度有限,大规模使用还是得自己部暑。

03 ConvertX:千种格式互转,告别野鸡转换网站
图片转 WebP、视频转 MP4、PDF 转 Word、电子书转 EPUB……一个 ConvertX 全包了。
支持超过一千种格式互转。部署在自己服务器上,数据不出内网。批量转换、密码保护、多用户管理都有。比起那些满屏广告的在线转换站,用着踏实多了。
首次配值得花点时间,冷门格式偶尔转换失败。对服务器硬件有一定要求,低配机器转大文件会比较慢。

三个项目,一个转录、一个抓数据、一个转格式,凑一起干活效率直接拉满。你们平时还有什么私藏的 GitHub 项目,评论区不分享一下?
项目地址:
Vibe → https://github.com/thewh1teagle/vibe
Firecrawl → https://github.com/firecrawl/firecrawl
ConvertX → https://github.com/C4illin/ConvertX