GitHub 今天涨星最快的 5 个项目,我跑了一遍发现个规律
GitHub Trending 今天这五个项目,说实话我看了一圈,发现一个挺有意思的规律:一半是帮 AI”吃进去”的,一半是帮 AI”吐出来”的。

先说”吐出来”的:AI 短视频
MoneyPrinterTurbo 这个名宇起得挺俗气,但功能确实直接——丢一个主题进去,它给你生成分镜、配音、画面,最后拼成一条短视频。我试了下”如何用 Python 爬虫抓数据”这个主题,3 分钟出片,虽然画面有点模板感,但做信息流短视频完全够用。
问题是:它生成的内容同质化严重,你用它、我用它,最后全网都是同一种”AI 味”口播。想做出差异化,还得人工改脚本。
再说”吃进去”的:文档转换
MarkItDown 是微软出的,把 PDF、Word、PPT 甚至图片里的文字全转成 Markdown。做 RAG(检索增强生成)的人应该懂这个痛点——知识库之前得先洗数据,这个工具就是洗数据的前置步骤。
不过我实测发现,表格转换丢格式的情况还是有,复杂排版的文章转完得人工校对一遍。不能指望全自动。
爬虫这块出了个新选手
Scrapling 主打”快+抗封”。现在网站反爬越来越狠,传统 Scrapy 动不动就被 403,这个库据说用了些绕过手段。我没深入测,但看作者简历是在数据采集团队干过,应该不是纸上谈兵。
隐患是:绕过反爬本身就在灰色地带,用在商业项目上得小心法律风险。
另外两个偏”学习向”
Build Your Own X 是个教程合集,从零写 Redis、写 Docker、写 Git… 适合那种”看了源码还是不懂,不如自己写一个”的人。我觉得比单纯看书有效,但时间成本也高,一个项目可能卡你两周。
Hermes WebUI 是给 Claude Code 这类 AI 编程工具做的可视化界面。命令行用久了确实累,有个 GUI 管理会话、看输出舒服很多。但目前功能还比较基础,跟 Cursor 自带的界面比差距明显。
我的判断
今天这五个项目,核心是同一个趋势:开发者不再满足于”用 AI”,而是开始”搭 AI 流水线”。短视频是输出端,Markdown 转换是输入端,爬虫是数据源,WebUI 是控制台,教程是人才储备。
这套拼图凑齐之后,AI 工作流才算真正跑顺。现在还缺哪块?我觉得是质量评估环节——AI 生成的内容到底好不好,目前主要靠人眼挑,自动化的评分体系几乎空白。这可能是下一个会爆的方向。