Reasonix:把 DeepSeek 缓存用到极致的终端编程(附安装包)
Claude Code没用过的也听过,这东西咋说呢,没多少缺点,但都很致命。
一个是贵的要命,另外一个是老是封号。
后面我就想着用别的方法,Claude+DeepSeek,效果惊人!
便宜的我想哭!!!
你们懂吗?

核心思路
DeepSeek API 本身有前缀缓存机制——请求的前缀和上次完全一样时,前面算过的 token 直接复用,价格降到 1/10。但问题是大多数 Agent 框架(LangChain、LlamaIndex 这些)每轮对话都会重新排列消息、注入时间戳、改系统提示词,随便哪个操作就把前缀一致性破坏了,命中率直接掉到 20% 以下。
Reasonix 的做法很直接:把上下文拆成三个严格隔离的区域。
- IMMUTABLE PREFIX —— 系统提示、工具定义、示例,会话期间锁死不改
- APPEND-ONLY LOG —— 对话历史只能追加,禁止修改,旧轮次自动成为新轮次的前缀
- VOLATILE SCRATCH —— 每轮重置的临时区,R1 的思考链放这里,不上传 API
不可变的东西锁死,只留追加口,命中率自然就上去了。
额外修复
除了缓存优化,Reasonix 还修了 DeepSeek 工具调用的四个老毛病:深层 schema 漏字段、思考标签里丢工具调用 JSON、max_tokens 截断导致 JSON 不完整、连续重复调用同一工具。全部默认开启,不用配。
实际效果
官方数据:5 轮多轮对话缓存命中率 85.2%,省了 93.9% 的费用;2 轮带工具对话命中率 94.9%。还有一个有意思的功能是并行推理——同时跑 3 路 R1 选最优,正确率能提升 10-15 个百分点,成本还是单次 Claude 的 1/5。
下载链接:
我用夸克网盘分享了「5-6月软件合集」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。
链接:https://pan.quark.cn/s/9e467748353c