Reasonix:把 DeepSeek 缓存用到极致的终端编程 Agent
用 Claude Code 大半年,最大的感受就一个字——贵。几十轮对话下来,账单肉眼可见地涨。最近翻到一个专门针对 DeepSeek 的开源项目 Reasonix,看完数据确实有点东西:单日跑了 4.35 亿 token,实际花了 12 美元,同等负载不缓存要 61 美元,缓存命中率 99.82%。

核心思路
DeepSeek API 本身有前缀缓存机制——请求的前缀和上次完全一样时,前面算过的 token 直接复用,价格降到 1/10。但问题是大多数 Agent 框架(LangChain、LlamaIndex 这些)每轮对话都会重新排列消息、注入时间戳、改系统提示词,随便哪个操作就把前缀一致性破坏了,命中率直接掉到 20% 以下。
Reasonix 的做法很直接:把上下文拆成三个严格隔离的区域。
- IMMUTABLE PREFIX —— 系统提示、工具定义、示例,会话期间锁死不改
- APPEND-ONLY LOG —— 对话历史只能追加,禁止修改,旧轮次自动成为新轮次的前缀
- VOLATILE SCRATCH —— 每轮重置的临时区,R1 的思考链放这里,不上传 API
不可变的东西锁死,只留追加口,命中率自然就上去了。
额外修复
除了缓存优化,Reasonix 还修了 DeepSeek 工具调用的四个老毛病:深层 schema 漏字段、思考标签里丢工具调用 JSON、max_tokens 截断导致 JSON 不完整、连续重复调用同一工具。全部默认开启,不用配。
实际效果
GitHub README 上的数据:5 轮多轮对话缓存命中率 85.2%,省了 93.9% 的费用;2 轮带工具对话命中率 94.9%。还有一个有意思的功能是并行推理——同时跑 3 路 R1 选最优,正确率能提升 10-15 个百分点,成本还是单次 Claude 的 1/5。
安装使用
npm install -g reasonix,然后 reasonix code 项目目录就能用,支持 macOS、Linux、Windows。内置三个预设模式:fast(日常)、smart(复杂推理)、max(三路采样最高质量)。即使用最贵的 max,单次成本依然低于 Claude Code。