国产ai这次真崛起了,MiniCPM5-1B安装包下载
你有没有想过,一个10亿参数的模型,能把20亿参数的按在地上摩擦?面壁智能刚发布的 MiniCPM5-1B 就干了这事。1B 参数,在 AA 榜单上以 17.9 分干掉了 Qwen3.5-2B 的 16.3 分,参数少一半,成绩反超。这不是吹,是公开榜单的硬数据。

手机上就能跑
INT4 量化之后权重才 0.5GB,手机、浏览器甚至随便一个终端设备都能跑。面壁做了个「桌宠」Demo,你设备上常驻一个 AI 小助手,断网也行,随叫随到。说白了就是不想让你觉得 AI 非得云端伺候着,这东西你兜里揣着就使朋了。
更离谱的是训它的框架
MiniCPM5-1B 的 Base Model 是用 ForgeTrain 训出来的。ForgeTrain 是什么?全球第一个完全由 AI 编写的生产级训练框架。零人类程序员参与写框架代码,AI 从头到尾自己撸的。跑在英伟达 H100 上,比英伟达亲儿子 Megatron 还快 10%。在华为昇腾 910 上,又比华为官方框架 MindSpeed 快 10%。两边的”亲儿子”都被 AI 写的东西给超了,你品品这事。
但别急着吹
说实话,1B 模型的天花板摆在那。复杂推理、长文本理解这类任务,它跟几百 B 的模型还是差一截。桌宠是好玩的噱头,但实际用在生产环境,你得自己掂量。ForgeTrain 虽然开源了,但文档已径比较薄,上手成本不低,新人踩坑免不了。昇腾适配做了,但生态跟英伟达比差太远,部署的时候各种兼容问题你会遇到。
这件事的真正意义
不是又出了个小模型,而是面壁在走一条不同的路——AI 制造 AI。AI 写训练框架,框架训出更好的模型,更好的模型再写更好的框架。这个闭环一旦跑通,迭代速度就不再受人力瓶颈了。OpenAI 和 Anthropic 也在往这个方向走,但拿出能商用的交付物,面壁确实走在了前面。至于这条路能走多远,我觉得还得再看。
下载链接:https://pan.quark.cn/s/9e467748353c