你的电脑到底能跑哪个大模型?一键测出来
最近想入手一张RTX 4090,但纠结的问题不是买不买得起,而是买了到底能跑哪些开源大模型。网上推荐贴一堆,参数写得天花乱坠,真到自己机器上能不能跑、跑得动跑不动,没人说得清。后来找到一个命令行工具whichllm,总算把这事搞明白了。

硬件识别
whichllm打开就能用,自动检测你机器上的显卡、内存、CPU。NVIDIA、AMD、苹果M系列芯片都认,甚至纯CPU环境也能分析。不用手动填参数,它直接读你系统的硬件信息,比你自己查规格表省事多了。苹果的统一内存架构、多显卡部分卸载这些细节,它都会考虑进去。
真实排名
这是我觉得最有价值的部分。它不是简单按参数量排个序就完事了,而是从HuggingFace多个benchmark来源汇总数据,还做了置信度标注。有些模型测评数据太少,它会明确告诉你”证据不足”,这种诚实态度比那些无脑吹的推荐贴强太多。排名结果直接显示每个模型的现存需求和预估生成速度,一眼就能看出哪些能全速跑、哪些只能勉强加载。

假装换卡
还没买卡也能用。加个--gpu "RTX 4090"参数就能模拟指定显卡的效果,甚至可以模拟双卡--gpu "2x RTX 4090"。我对比了4090和5090跑模型的差异,省得买完才后悔。还有个plan命令,输入想跑的模型名,它会反推你需要什么硬件,买卡前查一下心里有底。
一键开跑
选完模型不用自己折腾环境,whichllm run直接拉起来对话。想集成到自己代码里,用snippet命令能生成现成的Python片段,复制粘贴就能用。支持JSON和Markdown两种输出格式,拿来做自动化也很方便。不想安装的话,uvx whichllm@latest一行命令就能试用,零负担。
说点不足
这工具确实好用,但缺点也明显。首先是命令行界面,对普通用户不太友好,没有图型化界面劝退不少人。其次模型库依赖HuggingFace的数据,一些国产模型和新发布的模型还没收进去,排名不够全面。另外速度预估是基于理论计算的,跟实际跑起来还是有一点偏差,建议当参考别当结论。
下载地址:https://pan.quark.cn/s/f9c597e88b66
GitHub: https://pan.quark.cn/s/f9c597e88b66