当前位置：52软件资源库 > AI合集 > Reasonix：把 DeepSeek 缓存用到极致的终端编程 Agent

sakura AI合集 12小时前

Reasonix：把 DeepSeek 缓存用到极致的终端编程 Agent

用 Claude Code 大半年，最大的感受就一个字——贵。几十轮对话下来，账单肉眼可见地涨。最近翻到一个专门针对 DeepSeek 的开源项目 Reasonix，看完数据确实有点东西：单日跑了 4.35 亿 token，实际花了 12 美元，同等负载不缓存要 61 美元，缓存命中率 99.82%。

Reasonix 三区架构示意图

核心思路

DeepSeek API 本身有前缀缓存机制——请求的前缀和上次完全一样时，前面算过的 token 直接复用，价格降到 1/10。但问题是大多数 Agent 框架（LangChain、LlamaIndex 这些）每轮对话都会重新排列消息、注入时间戳、改系统提示词，随便哪个操作就把前缀一致性破坏了，命中率直接掉到 20% 以下。

Reasonix 的做法很直接：把上下文拆成三个严格隔离的区域。

IMMUTABLE PREFIX —— 系统提示、工具定义、示例，会话期间锁死不改
APPEND-ONLY LOG —— 对话历史只能追加，禁止修改，旧轮次自动成为新轮次的前缀
VOLATILE SCRATCH —— 每轮重置的临时区，R1 的思考链放这里，不上传 API

不可变的东西锁死，只留追加口，命中率自然就上去了。

额外修复

除了缓存优化，Reasonix 还修了 DeepSeek 工具调用的四个老毛病：深层 schema 漏字段、思考标签里丢工具调用 JSON、max_tokens 截断导致 JSON 不完整、连续重复调用同一工具。全部默认开启，不用配。

实际效果

GitHub README 上的数据：5 轮多轮对话缓存命中率 85.2%，省了 93.9% 的费用；2 轮带工具对话命中率 94.9%。还有一个有意思的功能是并行推理——同时跑 3 路 R1 选最优，正确率能提升 10-15 个百分点，成本还是单次 Claude 的 1/5。

安装使用

npm install -g reasonix，然后 reasonix code 项目目录就能用，支持 macOS、Linux、Windows。内置三个预设模式：fast（日常）、smart（复杂推理）、max（三路采样最高质量）。即使用最贵的 max，单次成本依然低于 Claude Code。

下载链接：https://pan.quark.cn/s/4243a4ae335f

有问题反馈加微信：mue233 私聊问我微信公众号：焦虑自愈教程，分享过去走出来的经验
52软件资源库 » Reasonix：把 DeepSeek 缓存用到极致的终端编程 Agent

sakura 普通

分享到：

发表回复取消回复

要发表评论，您必须先登录。