sakura GitHub精选下载 2026-06-21

你的电脑到底能跑哪个大模型？一键测出来

最近想入手一张RTX 4090，但纠结的问题不是买不买得起，而是买了到底能跑哪些开源大模型。网上推荐贴一堆，参数写得天花乱坠，真到自己机器上能不能跑、跑得动跑不动，没人说得清。后来找到一个命令行工具whichllm，总算把这事搞明白了。

硬件识别

whichllm打开就能用，自动检测你机器上的显卡、内存、CPU。NVIDIA、AMD、苹果M系列芯片都认，甚至纯CPU环境也能分析。不用手动填参数，它直接读你系统的硬件信息，比你自己查规格表省事多了。苹果的统一内存架构、多显卡部分卸载这些细节，它都会考虑进去。

真实排名

这是我觉得最有价值的部分。它不是简单按参数量排个序就完事了，而是从HuggingFace多个benchmark来源汇总数据，还做了置信度标注。有些模型测评数据太少，它会明确告诉你”证据不足”，这种诚实态度比那些无脑吹的推荐贴强太多。排名结果直接显示每个模型的现存需求和预估生成速度，一眼就能看出哪些能全速跑、哪些只能勉强加载。

假装换卡

还没买卡也能用。加个--gpu "RTX 4090"参数就能模拟指定显卡的效果，甚至可以模拟双卡--gpu "2x RTX 4090"。我对比了4090和5090跑模型的差异，省得买完才后悔。还有个plan命令，输入想跑的模型名，它会反推你需要什么硬件，买卡前查一下心里有底。

一键开跑

选完模型不用自己折腾环境，whichllm run直接拉起来对话。想集成到自己代码里，用snippet命令能生成现成的Python片段，复制粘贴就能用。支持JSON和Markdown两种输出格式，拿来做自动化也很方便。不想安装的话，uvx whichllm@latest一行命令就能试用，零负担。