跳转到主内容
本站为独立第三方技术服务商,Claude™ 与 Anthropic® 为 Anthropic, PBC 的商标,本站与 Anthropic 无任何关联、授权或合作关系。

Claude API 价格与模型选择指南(2026最新)

2026年最新Claude API定价:Opus $5/MTok、Sonnet $3/MTok、Haiku $1/MTok,含claudeapi.com人民币换算表、四大省钱技巧与模型选择决策树,一文搞懂怎么用最少的钱跑最强的AI。

价格指南价格指南模型选择预计阅读15分钟
2026.03.15 发表
Claude API 价格与模型选择指南(2026最新)

一、30 秒搞懂 Claude API 到底多少钱

  • 三档模型,三档价位:Haiku 4.5($1 / $5)、Sonnet 4.6($3 / $15)、Opus 4.7($5 / $25),单位:USD / 百万 Token,输入价 / 输出价。
  • Opus 4.7 与 4.6 同价并存:4.7 是当前最新旗舰,4.6 仍在线作为稳定版。两者输入 $5、输出 $25,价格完全一致。
  • claudeapi.com 走人民币计价:Opus 4.7 ¥20 / ¥100、Sonnet 4.6 ¥4 / ¥20、Haiku 4.5 ¥1 / ¥5(每百万 Token)。美金就是美金、人民币就是人民币,支付时自由选择结算货币,不存在统一汇率换算。
  • 充值阶梯优惠:$100 起减 2%、$300 减 3%、$500 减 5%。支持 Stripe 卡支付与 Stripe 支付宝两种通道。

二、Anthropic 官方最新定价(美金口径)

下表是 Anthropic 官方在售模型的标准计价,单位均为 USD / 百万 Token(MTok)

模型 输入 5 分钟缓存写入 1 小时缓存写入 缓存命中 输出
Claude Opus 4.7 ⭐ 最新 $5 $6.25 $10 $0.50 $25
Claude Opus 4.6 $5 $6.25 $10 $0.50 $25
Claude Opus 4.5 $5 $6.25 $10 $0.50 $25
Claude Sonnet 4.6 ⭐ 主力 $3 $3.75 $6 $0.30 $15
Claude Sonnet 4.5 $3 $3.75 $6 $0.30 $15
Claude Haiku 4.5 ⭐ 高频 $1 $1.25 $2 $0.10 $5

数据来源:Anthropic 官方 Pricing 文档,2026-05-21 抓取。

几个不容易注意到的细节,先讲清楚:

** Opus 4.7 新分词器**:Opus 4.7 换了新 tokenizer,相同的文本,最多可能多消耗约 35% Token。这意味着同一段中文输入,4.7 的实际账单可能比 4.6 高出 1/3 左右——选 4.7 是看重能力,省钱仍然该用 Sonnet 4.6。

** 1M 上下文标准价**:Opus 4.7、Opus 4.6、Sonnet 4.6 现在的 100 万 Token 上下文窗口全段统一定价,9 千 Token 请求和 90 万 Token 请求按同样单价计费。Sonnet 4.5 没有这个待遇——超过 200K 输入仍然要按溢价(输入 $6、输出 $22.5)计费,老项目尽快迁移到 4.6。

** Fast 模式 6 倍溢价**:Opus 4.6 / 4.7 支持 Fast 模式(研究预览),输入 $30 / 输出 $150,按 6 倍标准价计费。除非你在做交互式 IDE 体验,不然没必要。

** Web Search 单独计费**:内置 Web Search 工具按 $10 / 1000 次搜索计费,搜索结果产生的 Token 单独按输入价计入。


三、claudeapi.com 人民币计价

claudeapi.comclaudeapi.com 团队运营的国内 Claude API 中转,定位是「让国内开发者不折腾、不科学上网,直接用上 Claude」。计价规则非常直接:美金就是美金、人民币就是人民币,你选哪个结算货币,按哪个币种扣费,没有所谓的「2.5 倍率换算」。

3.1 人民币标准价(每百万 Token)

模型 输入 输出 5 分钟缓存写入 1 小时缓存写入 缓存命中
Claude Opus 4.7 ¥20 ¥100 ¥25 ¥40 ¥2
Claude Opus 4.6 ¥20 ¥100 ¥25 ¥40 ¥2
Claude Sonnet 4.6 ¥4 ¥20 ¥5 ¥8 ¥0.4
Claude Haiku 4.5 ¥1 ¥5 ¥1.25 ¥2 ¥0.1

缓存倍率与官方一致:5 分钟缓存写入 1.25×、1 小时缓存写入 2×、缓存命中 0.1×。

3.2 1 元能买多少 Token

模型 1 元 ≈ 输入 Token 1 元 ≈ 输出 Token 一次典型对话(200 in / 500 out)
Haiku 4.5 100 万 20 万 ≈ ¥0.0027
Sonnet 4.6 25 万 5 万 ≈ ¥0.0108
Opus 4.7 5 万 1 万 ≈ ¥0.054

中文换算约 1 Token ≈ 1.3 个汉字;Opus 4.7 因新 tokenizer 实际可能再多 ~35%,请按 Opus 4.7 行数字 × 1.35 估算保险。

3.3 美金结算同样可选

充值页同时提供 USD($)CNY(¥) 两个结算货币选项,付款方式支持:

  • Stripe 卡支付:Visa / Mastercard / JCB / American Express
  • Stripe 支付宝:人民币结算更友好

如果你在外企报销美金、或者发票要美金账单,直接选 USD 结算;如果是个人开发者,CNY 通道更省事。


四、充值阶梯优惠

下表是充值中心的快捷金额档位(USD 计):

充值金额 实付 折扣 适合人群
$10 $10 轻量备用
$30 $30 小额续费
$50 $50 无折扣门槛
$100 $98 -2% 小额续费
$300 $291 -3% 推荐档位
$500 $475 -5% 高性价比
  • 最低充值 $1,无上限
  • 自定义金额 支持任意填,金额达阈值自动应用对应折扣
  • 充值实时到账,账户余额永久有效、不过期
  • 支持开票(联系客服走对公或个人电子发票通道)
  • 兑换码 通道开放,活动期可在控制台直接兑换

五、选模型决策树:别上来就 Opus 4.7

很多人看到「最新最强」就直接选 Opus 4.7,结果月底账单吓一跳。正确的姿势是按任务复杂度梯度分配:

你的任务是什么?

├── 分类 / 抽取 / 短问答 / 翻译 / 路由判断
│   → Haiku 4.5(¥1 / ¥5 每 MTok)

├── 日常编程 / 内容创作 / 文档分析 / 客服 / RAG 问答
│   → Sonnet 4.6(¥4 / ¥20 每 MTok)—— 90% 场景的甜点

└── 复杂代码重构 / 多 Agent 协同 / 长上下文深度推理
    → Opus 4.7(¥20 / ¥100 每 MTok)—— 关键决策才用
你的任务是什么?

├── 分类 / 抽取 / 短问答 / 翻译 / 路由判断
│   → Haiku 4.5(¥1 / ¥5 每 MTok)

├── 日常编程 / 内容创作 / 文档分析 / 客服 / RAG 问答
│   → Sonnet 4.6(¥4 / ¥20 每 MTok)—— 90% 场景的甜点

└── 复杂代码重构 / 多 Agent 协同 / 长上下文深度推理
    → Opus 4.7(¥20 / ¥100 每 MTok)—— 关键决策才用

实战分配建议

一个生产应用合理的模型分布大概长这样:

调用占比 模型 用途
60-70% Haiku 4.5 路由、初筛、格式化、轻量响应
20-30% Sonnet 4.6 主要业务逻辑、内容生成
5-10% Opus 4.7 复杂规划、关键决策、降级兜底

举个数字:每月 1000 万 Token 输入 + 200 万 Token 输出,若全部用 Sonnet 4.6 是 ¥40 + ¥40 = ¥80;若按上面分配(70% Haiku / 25% Sonnet / 5% Opus 4.7),约为 ¥7 + ¥10 + ¥1 + ¥7 + ¥2.5 + ¥10 = ¥37.5。省下来一半多。


六、三大省钱杠杆

省钱百分比与币种无关,因为折扣按比例叠加。

7.1 Prompt Caching:命中即 90% off

把不变的系统提示、长文档、固定 few-shot 例子打上缓存断点:

  • 写入:5 分钟缓存 1.25 倍输入价、1 小时缓存 2 倍
  • 命中:仅 0.1 倍输入价——以 Sonnet 4.6 为例,¥4 → ¥0.4

适合:RAG 知识库、固定系统提示、Agent 工作流、多轮对话历史。5 分钟缓存只要被读 1 次就回本,1 小时缓存读 2 次回本——几乎没有不开的理由。

开启方式只要在请求顶层加一个 cache_control 字段,系统自动管断点:

import anthropic

client = anthropic.Anthropic(
    api_key="sk-xxx",
    base_url="https://gw.claudeapi.com",
)

resp = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "你是一个法律顾问,参考以下法规库回答……(长文档)",
            "cache_control": {"type": "ephemeral"},
        }
    ],
    messages=[{"role": "user", "content": "合同里这条违约金条款有效吗?"}],
)
print(resp.usage)
import anthropic

client = anthropic.Anthropic(
    api_key="sk-xxx",
    base_url="https://gw.claudeapi.com",
)

resp = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "你是一个法律顾问,参考以下法规库回答……(长文档)",
            "cache_control": {"type": "ephemeral"},
        }
    ],
    messages=[{"role": "user", "content": "合同里这条违约金条款有效吗?"}],
)
print(resp.usage)

7.2 控制输出长度

输出价格通常是输入的 5 倍,回复越长,账单越高。可操作清单:

  • 提示词写明「只返回 JSON / 不要解释 / 不超过 N 字」
  • 用结构化输出(tool_use 或 JSON Schema),避免模型自由发挥
  • 长文档先用 Haiku 4.5 切片摘要,再喂给 Sonnet/Opus 做最终处理
  • 多轮对话定期裁剪历史,只保留最近 N 轮 + 摘要
resp = client.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=200,
    system="只返回 JSON,字段: {category, confidence}。不要任何额外解释。",
    messages=[{"role": "user", "content": "用户反馈:这个按钮点了没反应"}],
)
resp = client.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=200,
    system="只返回 JSON,字段: {category, confidence}。不要任何额外解释。",
    messages=[{"role": "user", "content": "用户反馈:这个按钮点了没反应"}],
)

七、接入:一行 base_url 就够

claudeapi.com 完全兼容 Anthropic 官方 SDK,只需替换 base_url

Python(官方 anthropic SDK)

import anthropic

client = anthropic.Anthropic(
    api_key="sk-xxx-你的-claudeapi-密钥",
    base_url="https://gw.claudeapi.com",
)

resp = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.content[0].text)
import anthropic

client = anthropic.Anthropic(
    api_key="sk-xxx-你的-claudeapi-密钥",
    base_url="https://gw.claudeapi.com",
)

resp = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.content[0].text)

Node.js / TypeScript

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.CLAUDEAPI_KEY!,
  baseURL: "https://gw.claudeapi.com",
});

const resp = await client.messages.create({
  model: "claude-sonnet-4-6",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Hello" }],
});
console.log(resp.content[0]);
import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.CLAUDEAPI_KEY!,
  baseURL: "https://gw.claudeapi.com",
});

const resp = await client.messages.create({
  model: "claude-sonnet-4-6",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Hello" }],
});
console.log(resp.content[0]);

cURL(OpenAI 兼容路径)

curl https://gw.claudeapi.com/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "messages": [{"role": "user", "content": "Hello"}]
  }'
curl https://gw.claudeapi.com/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

八、常见问题 FAQ

Q1:为什么不是「1 元 = 1 美元额度」那种统一汇率?

新版充值改成了双货币结算:你选 USD,按 USD 扣;你选 CNY,按 CNY 扣。美金就是美金、人民币就是人民币,不再做隐形换算。这样的好处是账单透明、对公开票口径清楚,也不用担心汇率波动让上个月的预算今天对不上。

Q2:Opus 4.7 比 Opus 4.6 价格一样,为啥还要 4.6?

价格一样,但 Opus 4.7 换了新 tokenizer,相同中文文本可能多消耗 ~35% Token。如果你的项目对 Token 用量敏感,且 4.6 的能力已经够用,可以暂留在 4.6;如果你在做最难的代码重构、深度规划,4.7 的智能提升值得多花的那 35%。

Q3:1M 上下文有溢价吗?

Opus 4.7 / 4.6 / Sonnet 4.6 的 1M 上下文窗口全段统一定价,没有 200K 门槛。只有 Sonnet 4.5 仍然存在 200K 溢价(输入 $6、输出 $22.5),建议尽快迁到 4.6。

Q4:Prompt Caching 真的能省 90% 吗?

缓存命中价 = 0.1 × 输入价。如果你的请求里 80% 是固定上下文(系统提示 + 长文档),缓存命中后输入部分的成本就是原来的 10%。5 分钟缓存读 1 次回本、1 小时缓存读 2 次回本,命中越多省得越多。

Q5:充值后多久到账?

实时到账。Stripe 卡支付与 Stripe 支付宝都是支付成功立即到账户余额,可以马上跑 API。

Q6:余额会过期吗?

不过期。账户余额永久有效,按 Token 实际消耗扣减。

Q7:能开发票吗?

可以。个人电子发票、企业增值税普通发票都支持,对公转账+开票联系客服走专属通道。


九、写在最后

把这篇收藏起来吧——下次升级模型、做预算、写报销、谈渠道时翻出来直接抄表。

如果只能记一件事,记这条:绝大多数生产场景,Sonnet 4.6 + Prompt Caching + Batch API 三件套,已经能拿到接近最优的成本/质量平衡。Opus 4.7 留给最难的那 5-10% 任务;Haiku 4.5 用于高频的轻量路由。

👉 立即注册 claudeapi.com💰 前往充值中心🤝 申请渠道合作

本文定价校对于 2026-05-21。Claude API 价格如有调整,以 Anthropic 官方与 claudeapi.com 控制台实时公示为准。

相关文章