微软开源SkillOpt:AI自动优化Skill文件,GPT-5.5平均涨23.5分

微软开源SkillOpt:AI自动优化Skill文件,GPT-5.5平均涨23.5分

给 Skill 文件里加了一堆规则,Agent 反而越跑越差——这个坑你踩过吗?

微软悄然开源了 SkillOpt,思路是把 Skill 本身变成能反复训练、自动优化的东西。请了两个模型搭班子:一个专心干活,另一个在旁边盯着琢磨 Skill 怎么改。

流程是:干活的模型按当前 Skill 完成一批任务,哪些做成了哪些搞砸了全程记录。优化的模型来复盘,成功的吸取经验,失败的找规律——是不是总在同一个地方出错。然后动手改 Skill 文件,每次只准小改几处(论文数据显示控制在4处效果最好),防止步子迈大把原本好用的规矩也改了。

改完要通过测试才算数:用没做过的新任务跑一遍,结果变好保留,没变好立即退回上一版本。被否掉的改动存进「失败记录」,下次优化时知道哪些路走不通,不在原地打转。

测试结果:覆盖查资料、做表格、读文档、解数学题6类任务,7个不同模型,52次测试全部拿第一或并列第一。换上优化后的 Skill,GPT-5.5 平均涨了23.5分,表格类任务提升接近39分——这些提升是在没动模型本身的前提下拿到的。

安装:
git clone https://github.com/microsoft/SkillOpt.git && cd SkillOpt && pip install -e .

支持 OpenAI、Anthropic、Qwen 等主流模型。准备两份带答案的测试题(一份训练一份验证),执行命令启动,等 Skill 文件自动优化输出。也提供 WebUI 可以实时看训练过程。

项目下载:https://pan.quark.cn/s/6f22fd03bfd1

GitHub 项目地址:https://github.com/microsoft/SkillOpt


52软件资源库 » 微软开源SkillOpt:AI自动优化Skill文件,GPT-5.5平均涨23.5分

发表回复