本周在GitHub挖到6个项目 比装一堆软件靠谱多了

同样的视频内容,有人花两小时看完做满笔记,有人二十分钟就带着结构化笔记出来了。差别不是智商,是工具用对了。这周在 GitHub 上来回翻,挑出几个我觉得真能省时间的项目,挨个说说。

记笔记和截图,这俩搭配着来

看技术视频最烦啥?暂停、回放、手忙脚乱记笔记。BiliNote 干的事很简单——自动抓取 B 站和 YouTube 的视频信息,直接生成 markdown 笔记。时间戳、字幕、要点都给你整理好了。我上个月拿它记了个 40 分钟的 K8s 教程,省下来的时间够再刷一集。支持 B 站和 YouTube 双平台这点也还行,不过它对部分付费课程的字幕抓取有缺段,偶尔会漏内容。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130506_65d0b3.webp

截图工具我推 ShareX,老牌归老牌,功能确实全。截图只是基础操作,录屏、OCR、自动上传图床、标注、取色、标尺,该有的都有。我用得最多的流程是截图直接上传图床,链接自动进剪贴板,写文档贴图效率拉满。缺点是界面有点年代感,头一次打开会被菜单选项吓一跳,但习惯之后效率翻倍。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130507_dfc5b5.webp

让 AI 替你操作浏览器

skyvern 的思路挺有意思——把 LLM 和浏览器自动化捆一块。你用自然语言告诉它”去某个网站搜一下 XX 产品的价格”,它自己打开浏览器、点击、输入、翻页,最后把结果整理好返回。不像传统 RPA 靠固定规则,它能理解页面语义,页面改版也不怕。我拿它跑过竞品价格数据采集,大部分场景能 hold 住,但遇到复杂表单时偶尔会卡住,得多试几次。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130507_0bd1d6.webp

安全测试也能用 AI 跑了

strix 是给做安全审计的人准备的。给它一个目标地址,它会结合 LLM 推理和传统扫描手段去找 SQL 注入、XSS、越权访问这类漏洞。跟传统扫描器最大的区别在于,它能理解业务上下文,不是无脑堆 payload,而是根据上下文构造更精准的测试用例。用之前建议想清楚合规问题,别拿它乱扫别人的站点。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130508_5e93fc.webp

家里摄像头接上 AI 检测

frigate 是个开源的 AI 摄像头后端,能接家里的网络摄像头做实时目标检测。识别是人、猫还是快递小哥,全程本地运行不以来云端,延迟低隐私也好。我部署在 NAS 上接了两个摄像头,检测准确率比预期高不少,晚上红外模式下也能准确区分人和流浪猫。缺点是比较吃硬件,CPU 推理会卡,最好配个 GPU 或者 Coral TPU。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130509_03588d.webp

想学 Agent 开发看这个

Datawhale 社区搞的 hello-agents,把 AI Agent 相关的论文、主流框架和实战案例都疏理了一遍。从入门到跑通一个 Agent 的路径很清晰,适合想做 Agent 开发但不知道从哪下手的人。内容还在持续更新中,部分章节的深度还差点意思,有些引用的论文解读得自己再去看原文才行。

https://lifan.acg28.top/wp-content/uploads/imgbed/2026/06/20260607_130509_836fb5.webp

翻了一圈 GitHub 收藏夹,真正留下来反复用的也就这几个。工具这东西,说到底还是看它能不能帮你解决一个具体的问题——你最近有遇到什么重复劳动想自动化的吗?

下载链接:https://pan.quark.cn/s/df7d601e740d

分享github精选项目,AI最新的消息资讯和使用教程技巧
52软件资源库 » 本周在GitHub挖到6个项目 比装一堆软件靠谱多了