💰 算一笔账

你的$100余额花得合理吗?还能用多久?怎么延长?

⏳ 你的余额还能撑多久?

中转站后台显示的剩余额度

看中转站后台昨天的消费

还能用

20

日均消费

$5.00
月均 $110

消耗速度

健康
消费合理

🔍 单次请求:中转站扣的对不对?

输入一次请求的Token数,对比中转站实际扣费和官方应收价

API返回的 input_tokens

API返回的 output_tokens

余额变化(扣前-扣后)

官方应收

$0.0210
输入 $0.0060 + 输出 $0.0150

中转站实扣

$0.0800

偏差

+281.0%
🔴 明显异常
⚠️ 偏差超过30%,可能原因:中转站注入了隐藏System Prompt(虚增input tokens)、 加价倍率高、或Token计数方式不同。建议用 npx relay-radar verify 深入检测。

🚀 怎么让余额用更久?

剩余用Sonnet

优化方案:

1. 🔄 把Opus占比从 60% 降到 30%(简单任务用Sonnet)

2. 📦 开启 Prompt Cache(约省40%输入费用)

3. 🧠 设置 MAX_THINKING_TOKENS=10000

优化前

$1.64/天
余额撑 61

优化后

$0.90/天
余额撑 111
每天省 $0.74,余额多撑 50

📋 Anthropic 官方价格参考

数据来源:Anthropic官方(2026年4月),单位:$/百万tokens。用来和你中转站的单价对比。

模型输入输出缓存读缓存写(5m)Batch(5折)
Opus 4.6$5$25$0.5$6.25$2.50/$12.5
Opus 4.5$5$25$0.5$6.25$2.50/$12.5
Sonnet 4.6$3$15$0.3$3.75$1.50/$7.5
Sonnet 4.5$3$15$0.3$3.75$1.50/$7.5
Haiku 4.5$1$5$0.1$1.25$0.50/$2.5
Haiku 3.5$0.8$4$0.08$1$0.40/$2.0

💡 缓存读取仅输入价的10%——如果你的system prompt稳定,开启缓存是最大的省钱方法。

想深入检测你的中转站?

npx relay-radar verify
📊 我的用量🏆 中转站排名