一、30 秒搞懂 Claude API 到底多少钱
- 三档模型,三档价位:Haiku 4.5($1 / $5)、Sonnet 4.6($3 / $15)、Opus 4.7($5 / $25),单位:USD / 百万 Token,输入价 / 输出价。
- Opus 4.7 与 4.6 同价并存:4.7 是当前最新旗舰,4.6 仍在线作为稳定版。两者输入 $5、输出 $25,价格完全一致。
- claudeapi.com 走人民币计价:Opus 4.7 ¥20 / ¥100、Sonnet 4.6 ¥4 / ¥20、Haiku 4.5 ¥1 / ¥5(每百万 Token)。美金就是美金、人民币就是人民币,支付时自由选择结算货币,不存在统一汇率换算。
- 充值阶梯优惠:$100 起减 2%、$300 减 3%、$500 减 5%。支持 Stripe 卡支付与 Stripe 支付宝两种通道。
二、Anthropic 官方最新定价(美金口径)
下表是 Anthropic 官方在售模型的标准计价,单位均为 USD / 百万 Token(MTok)。
| 模型 | 输入 | 5 分钟缓存写入 | 1 小时缓存写入 | 缓存命中 | 输出 |
|---|---|---|---|---|---|
| Claude Opus 4.7 ⭐ 最新 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Opus 4.6 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Opus 4.5 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Sonnet 4.6 ⭐ 主力 | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Sonnet 4.5 | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Haiku 4.5 ⭐ 高频 | $1 | $1.25 | $2 | $0.10 | $5 |
数据来源:Anthropic 官方 Pricing 文档,2026-05-21 抓取。
几个不容易注意到的细节,先讲清楚:
** Opus 4.7 新分词器**:Opus 4.7 换了新 tokenizer,相同的文本,最多可能多消耗约 35% Token。这意味着同一段中文输入,4.7 的实际账单可能比 4.6 高出 1/3 左右——选 4.7 是看重能力,省钱仍然该用 Sonnet 4.6。
** 1M 上下文标准价**:Opus 4.7、Opus 4.6、Sonnet 4.6 现在的 100 万 Token 上下文窗口全段统一定价,9 千 Token 请求和 90 万 Token 请求按同样单价计费。Sonnet 4.5 没有这个待遇——超过 200K 输入仍然要按溢价(输入 $6、输出 $22.5)计费,老项目尽快迁移到 4.6。
** Fast 模式 6 倍溢价**:Opus 4.6 / 4.7 支持 Fast 模式(研究预览),输入 $30 / 输出 $150,按 6 倍标准价计费。除非你在做交互式 IDE 体验,不然没必要。
** Web Search 单独计费**:内置 Web Search 工具按 $10 / 1000 次搜索计费,搜索结果产生的 Token 单独按输入价计入。
三、claudeapi.com 人民币计价
claudeapi.com 是 claudeapi.com 团队运营的国内 Claude API 中转,定位是「让国内开发者不折腾、不科学上网,直接用上 Claude」。计价规则非常直接:美金就是美金、人民币就是人民币,你选哪个结算货币,按哪个币种扣费,没有所谓的「2.5 倍率换算」。
3.1 人民币标准价(每百万 Token)
| 模型 | 输入 | 输出 | 5 分钟缓存写入 | 1 小时缓存写入 | 缓存命中 |
|---|---|---|---|---|---|
| Claude Opus 4.7 | ¥20 | ¥100 | ¥25 | ¥40 | ¥2 |
| Claude Opus 4.6 | ¥20 | ¥100 | ¥25 | ¥40 | ¥2 |
| Claude Sonnet 4.6 | ¥4 | ¥20 | ¥5 | ¥8 | ¥0.4 |
| Claude Haiku 4.5 | ¥1 | ¥5 | ¥1.25 | ¥2 | ¥0.1 |
缓存倍率与官方一致:5 分钟缓存写入 1.25×、1 小时缓存写入 2×、缓存命中 0.1×。
3.2 1 元能买多少 Token
| 模型 | 1 元 ≈ 输入 Token | 1 元 ≈ 输出 Token | 一次典型对话(200 in / 500 out) |
|---|---|---|---|
| Haiku 4.5 | 100 万 | 20 万 | ≈ ¥0.0027 |
| Sonnet 4.6 | 25 万 | 5 万 | ≈ ¥0.0108 |
| Opus 4.7 | 5 万 | 1 万 | ≈ ¥0.054 |
中文换算约 1 Token ≈ 1.3 个汉字;Opus 4.7 因新 tokenizer 实际可能再多 ~35%,请按 Opus 4.7 行数字 × 1.35 估算保险。
3.3 美金结算同样可选
充值页同时提供 USD($) 与 CNY(¥) 两个结算货币选项,付款方式支持:
- Stripe 卡支付:Visa / Mastercard / JCB / American Express
- Stripe 支付宝:人民币结算更友好
如果你在外企报销美金、或者发票要美金账单,直接选 USD 结算;如果是个人开发者,CNY 通道更省事。
四、充值阶梯优惠
下表是充值中心的快捷金额档位(USD 计):
| 充值金额 | 实付 | 折扣 | 适合人群 |
|---|---|---|---|
| $10 | $10 | — | 轻量备用 |
| $30 | $30 | — | 小额续费 |
| $50 | $50 | — | 无折扣门槛 |
| $100 | $98 | -2% | 小额续费 |
| $300 | $291 | -3% | 推荐档位 |
| $500 | $475 | -5% | 高性价比 |
- 最低充值 $1,无上限
- 自定义金额 支持任意填,金额达阈值自动应用对应折扣
- 充值实时到账,账户余额永久有效、不过期
- 支持开票(联系客服走对公或个人电子发票通道)
- 兑换码 通道开放,活动期可在控制台直接兑换
五、选模型决策树:别上来就 Opus 4.7
很多人看到「最新最强」就直接选 Opus 4.7,结果月底账单吓一跳。正确的姿势是按任务复杂度梯度分配:
你的任务是什么?
│
├── 分类 / 抽取 / 短问答 / 翻译 / 路由判断
│ → Haiku 4.5(¥1 / ¥5 每 MTok)
│
├── 日常编程 / 内容创作 / 文档分析 / 客服 / RAG 问答
│ → Sonnet 4.6(¥4 / ¥20 每 MTok)—— 90% 场景的甜点
│
└── 复杂代码重构 / 多 Agent 协同 / 长上下文深度推理
→ Opus 4.7(¥20 / ¥100 每 MTok)—— 关键决策才用
你的任务是什么?
│
├── 分类 / 抽取 / 短问答 / 翻译 / 路由判断
│ → Haiku 4.5(¥1 / ¥5 每 MTok)
│
├── 日常编程 / 内容创作 / 文档分析 / 客服 / RAG 问答
│ → Sonnet 4.6(¥4 / ¥20 每 MTok)—— 90% 场景的甜点
│
└── 复杂代码重构 / 多 Agent 协同 / 长上下文深度推理
→ Opus 4.7(¥20 / ¥100 每 MTok)—— 关键决策才用
实战分配建议
一个生产应用合理的模型分布大概长这样:
| 调用占比 | 模型 | 用途 |
|---|---|---|
| 60-70% | Haiku 4.5 | 路由、初筛、格式化、轻量响应 |
| 20-30% | Sonnet 4.6 | 主要业务逻辑、内容生成 |
| 5-10% | Opus 4.7 | 复杂规划、关键决策、降级兜底 |
举个数字:每月 1000 万 Token 输入 + 200 万 Token 输出,若全部用 Sonnet 4.6 是 ¥40 + ¥40 = ¥80;若按上面分配(70% Haiku / 25% Sonnet / 5% Opus 4.7),约为 ¥7 + ¥10 + ¥1 + ¥7 + ¥2.5 + ¥10 = ¥37.5。省下来一半多。
六、三大省钱杠杆
省钱百分比与币种无关,因为折扣按比例叠加。
7.1 Prompt Caching:命中即 90% off
把不变的系统提示、长文档、固定 few-shot 例子打上缓存断点:
- 写入:5 分钟缓存 1.25 倍输入价、1 小时缓存 2 倍
- 命中:仅 0.1 倍输入价——以 Sonnet 4.6 为例,¥4 → ¥0.4
适合:RAG 知识库、固定系统提示、Agent 工作流、多轮对话历史。5 分钟缓存只要被读 1 次就回本,1 小时缓存读 2 次回本——几乎没有不开的理由。
开启方式只要在请求顶层加一个 cache_control 字段,系统自动管断点:
import anthropic
client = anthropic.Anthropic(
api_key="sk-xxx",
base_url="https://gw.claudeapi.com",
)
resp = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "你是一个法律顾问,参考以下法规库回答……(长文档)",
"cache_control": {"type": "ephemeral"},
}
],
messages=[{"role": "user", "content": "合同里这条违约金条款有效吗?"}],
)
print(resp.usage)
import anthropic
client = anthropic.Anthropic(
api_key="sk-xxx",
base_url="https://gw.claudeapi.com",
)
resp = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "你是一个法律顾问,参考以下法规库回答……(长文档)",
"cache_control": {"type": "ephemeral"},
}
],
messages=[{"role": "user", "content": "合同里这条违约金条款有效吗?"}],
)
print(resp.usage)
7.2 控制输出长度
输出价格通常是输入的 5 倍,回复越长,账单越高。可操作清单:
- 提示词写明「只返回 JSON / 不要解释 / 不超过 N 字」
- 用结构化输出(
tool_use或 JSON Schema),避免模型自由发挥 - 长文档先用 Haiku 4.5 切片摘要,再喂给 Sonnet/Opus 做最终处理
- 多轮对话定期裁剪历史,只保留最近 N 轮 + 摘要
resp = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=200,
system="只返回 JSON,字段: {category, confidence}。不要任何额外解释。",
messages=[{"role": "user", "content": "用户反馈:这个按钮点了没反应"}],
)
resp = client.messages.create(
model="claude-haiku-4-5-20251001",
max_tokens=200,
system="只返回 JSON,字段: {category, confidence}。不要任何额外解释。",
messages=[{"role": "user", "content": "用户反馈:这个按钮点了没反应"}],
)
七、接入:一行 base_url 就够
claudeapi.com 完全兼容 Anthropic 官方 SDK,只需替换 base_url:
Python(官方 anthropic SDK)
import anthropic
client = anthropic.Anthropic(
api_key="sk-xxx-你的-claudeapi-密钥",
base_url="https://gw.claudeapi.com",
)
resp = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[{"role": "user", "content": "你好"}],
)
print(resp.content[0].text)
import anthropic
client = anthropic.Anthropic(
api_key="sk-xxx-你的-claudeapi-密钥",
base_url="https://gw.claudeapi.com",
)
resp = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[{"role": "user", "content": "你好"}],
)
print(resp.content[0].text)
Node.js / TypeScript
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic({
apiKey: process.env.CLAUDEAPI_KEY!,
baseURL: "https://gw.claudeapi.com",
});
const resp = await client.messages.create({
model: "claude-sonnet-4-6",
max_tokens: 1024,
messages: [{ role: "user", content: "Hello" }],
});
console.log(resp.content[0]);
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic({
apiKey: process.env.CLAUDEAPI_KEY!,
baseURL: "https://gw.claudeapi.com",
});
const resp = await client.messages.create({
model: "claude-sonnet-4-6",
max_tokens: 1024,
messages: [{ role: "user", content: "Hello" }],
});
console.log(resp.content[0]);
cURL(OpenAI 兼容路径)
curl https://gw.claudeapi.com/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-6",
"messages": [{"role": "user", "content": "Hello"}]
}'
curl https://gw.claudeapi.com/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-6",
"messages": [{"role": "user", "content": "Hello"}]
}'
八、常见问题 FAQ
Q1:为什么不是「1 元 = 1 美元额度」那种统一汇率?
新版充值改成了双货币结算:你选 USD,按 USD 扣;你选 CNY,按 CNY 扣。美金就是美金、人民币就是人民币,不再做隐形换算。这样的好处是账单透明、对公开票口径清楚,也不用担心汇率波动让上个月的预算今天对不上。
Q2:Opus 4.7 比 Opus 4.6 价格一样,为啥还要 4.6?
价格一样,但 Opus 4.7 换了新 tokenizer,相同中文文本可能多消耗 ~35% Token。如果你的项目对 Token 用量敏感,且 4.6 的能力已经够用,可以暂留在 4.6;如果你在做最难的代码重构、深度规划,4.7 的智能提升值得多花的那 35%。
Q3:1M 上下文有溢价吗?
Opus 4.7 / 4.6 / Sonnet 4.6 的 1M 上下文窗口全段统一定价,没有 200K 门槛。只有 Sonnet 4.5 仍然存在 200K 溢价(输入 $6、输出 $22.5),建议尽快迁到 4.6。
Q4:Prompt Caching 真的能省 90% 吗?
缓存命中价 = 0.1 × 输入价。如果你的请求里 80% 是固定上下文(系统提示 + 长文档),缓存命中后输入部分的成本就是原来的 10%。5 分钟缓存读 1 次回本、1 小时缓存读 2 次回本,命中越多省得越多。
Q5:充值后多久到账?
实时到账。Stripe 卡支付与 Stripe 支付宝都是支付成功立即到账户余额,可以马上跑 API。
Q6:余额会过期吗?
不过期。账户余额永久有效,按 Token 实际消耗扣减。
Q7:能开发票吗?
可以。个人电子发票、企业增值税普通发票都支持,对公转账+开票联系客服走专属通道。
九、写在最后
把这篇收藏起来吧——下次升级模型、做预算、写报销、谈渠道时翻出来直接抄表。
如果只能记一件事,记这条:绝大多数生产场景,Sonnet 4.6 + Prompt Caching + Batch API 三件套,已经能拿到接近最优的成本/质量平衡。Opus 4.7 留给最难的那 5-10% 任务;Haiku 4.5 用于高频的轻量路由。
👉 立即注册 claudeapi.com | 💰 前往充值中心 | 🤝 申请渠道合作
本文定价校对于 2026-05-21。Claude API 价格如有调整,以 Anthropic 官方与 claudeapi.com 控制台实时公示为准。



