TRICKS · 5 个偏方

5 条偏方，
全是真省钱。

改 1 个字质量变 20%、Sonnet 4.5 砍 30% 成本、6 个看不到的 token 黑洞。短平快，每条 3 分钟能读完。

Claude 3.5 Sonnet 的 200K 上下文听着美，但每次请求把 30K 字符全塞进去，账单起飞。我这一年给 6 个生产 agent 调过 system prompt，下面 7 条偏方是其中最值得抄的 7 条。

Anthropic 的 prompt cache 特性藏得有点深，但只要你 system prompt 稳定、请求密度够大，一行配置就能砍 60-90% input 账单。这是我那个 7K-token 爬虫 agent 实测下来的数字。

流式返回不是省 token，是省延迟。但很多团队把它和 tool use 一起用时没算清楚账。本文用 5 个生产 case 拆给你看。

Sonnet 4.5 标价比 3.5 贵 60%，但实际账单我只多付 18%。原因在于：4.5 在 tool use 上 retry 少、cache 命中率高。我把 3 个生产场景的账拆给你。

你以为你优化了 prompt，其实有 6 个隐性 token 在偷你的预算。每个 1-3k，月账单悄悄多 30%。

5 条偏方，全是真省钱。