TRICKS · 5 个偏方
5 条偏方,
全是真省钱。
改 1 个字质量变 20%、Sonnet 4.5 砍 30% 成本、6 个看不到的 token 黑洞。短平快,每条 3 分钟能读完。
T1
Claude 长上下文时压 system prompt 的 7 个土方
Claude 3.5 Sonnet 的 200K 上下文听着美,但每次请求把 30K 字符全塞进去,账单起飞。我这一年给 6 个生产 agent 调过 system prompt,下面 7 条偏方是其中最值得抄的 7 条。
T2
Prompt cache 用对一次,API 账单砍 60%
Anthropic 的 prompt cache 特性藏得有点深,但只要你 system prompt 稳定、请求密度够大,一行配置就能砍 60-90% input 账单。这是我那个 7K-token 爬虫 agent 实测下来的数字。
T3
Streaming + Tool use 真实成本拆解
流式返回不是省 token,是省延迟。但很多团队把它和 tool use 一起用时没算清楚账。本文用 5 个生产 case 拆给你看。
T4
Sonnet 4.5 vs 3.5 怎么算账:3 个真实场景对比
Sonnet 4.5 标价比 3.5 贵 60%,但实际账单我只多付 18%。原因在于:4.5 在 tool use 上 retry 少、cache 命中率高。我把 3 个生产场景的账拆给你。
T5
Agent 的「无意识代价」:6 个你看不到的 token 黑洞
你以为你优化了 prompt,其实有 6 个隐性 token 在偷你的预算。每个 1-3k,月账单悄悄多 30%。