模型定价文档指南应用场景对比关于

登录开始使用

新上线 — Gemini 3、Claude Opus 4.7、Veo 3 全部接入

前沿模型，
低至官方 3 折。

OpenAI、Anthropic、Google 三大实验室的前沿模型 —— Claude、Gemini、GPT-Image、Veo —— 每一个都按官方价 3–7 折结算，统一收进一个 OpenAI 兼容 API。改一行 base_url 即可上线。

开始使用查看文档

5 秒接入 · 无需绑卡 · 无最低消费

粘贴给你的 AI Agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

已聚合的供应商

OpenAIAnthropicGoogle

30–70%

低于官方价

3,200+

活跃开发者

2.4 亿+

月 API 调用

99.95%

可用性 SLA

<120ms

P50 时延

200+

在线模型

为什么选 Kunavo

为出海开发者构建的 AI 网关。

从路由层到账本，每一层都为「独立开发者和小团队把 AI 功能交付给真实用户」这件事重新设计。

全球边缘网关

多区域 Anycast 路由 + 边缘 TLS 终止。北美、欧洲、亚太任意地区 P50 时延低于 120ms。

OpenAI 兼容

OpenAI SDK 的 drop-in 替代。Streaming、function calling、tool use、vision 全部线协议兼容，无需学习新 client。

Stripe 原生计费

信用卡、Apple Pay、Google Pay、ACH、SEPA、Alipay、微信 Pay —— Stripe 支持的方式我们都支持。自助充值、自动续费、发票全自动。

前沿模型，低至 3 折

OpenAI、Anthropic、Google 的每一个模型，都按官方挂牌价 3–7 折计费。Claude、Gemini、GPT-Image、Veo —— 文本、图像、视频，一份账单。

透明定价

每个模型的 per-1M-token 价格全部公示。无隐藏乘数、无意外溢价、失败请求不计费。

99.95% SLA

多供应商热备 + 50ms 内自动故障切换。任一上游抖动，请求在你察觉之前就被改写到备用通道。

原生流式

SSE pass-through 实现。首字 token 时间与上游官方一致 —— 不缓冲、不批处理、零延迟。

精细化用量

按模型、API key、IP 维度的调用级分析 + Webhook 事件推送。CSV 一键导出，便于业务对账。

Prompt 缓存，最高省 90%

Anthropic 模型缓存命中按 10% 输入价计费 —— 在 system prompt 上加 cache_control，长上下文重复读取近乎免费。命中率与节省金额在控制台实时可见。

−90%

Use cases

What to build with Kunavo.

Browse all use cases

模型市场

前沿模型，低至官方 3 折

浏览完整模型库

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

面向 AI Agent

把你的 Agent 指向 `llms.txt`
它就能用上每个模型。

把一句话交给 Claude Code、Cursor、Cline 或任何 OpenAI 兼容的 Agent。它会自己读取 Kunavo 的实时模型目录，驱动文本、图像、视频模型。无需 SDK，无需胶水代码。

OpenAI 线协议兼容 —— Agent 无需任何定制接入
GET /v1/models 即实时目录 —— 无需硬编码模型名
一把密钥贯通全模态：文本、图像、视频、音频

粘贴给你的 AI Agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

充值送额

按量付费，多充多得

预付钱包模式。$10 起步，无月费、无最低消费、余额永不过期。

Starter

想先试试

$10

全部模型可用
调用级用量明细
邮件 / 社区支持
无最低消费、无需绑卡

Most popular

Builder

限时 · 送 $10

正在构建产品

$100

充 $100 实得 $110
10 个独立 API Key
自动充值 · IP 白名单
优先邮件支持

Scale

限时 · 送 $250

已有稳定流量

$1000

充 $1000 实得 $1250
无限 API Key
Webhooks · 月度账单
Slack/Discord 专属支持

Enterprise

限时 · 送 $2000

大规模生产

$5000

充 $5000 实得 $7000
包含 Scale 全部权益
自定义限流与 SLA
专属客户经理

查看完整定价表

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

常见问题

你想知道的，
都在这里。

还没解答你的疑问？发邮件到 contact@kunavo.com，我们 24 小时内回复。

Kunavo 专门为独立开发者和小团队的生产级 AI 功能设计。三个真实差异：(1) 文本、图像、视频统一计费 —— 大部分聚合平台只做文本；(2) Stripe 原生结账，ACH、SEPA、Apple Pay、微信支付全部支持，无需走线下发票；(3) 路由完全透明 —— 我们绝不偷换你的模型到更便宜的版本。
每个模型价格约为官方挂牌价的 3–7 折（立省 30–70%），充值越多额外赠送越多。再加上运营层面的省心：一份合同、一份发票、一套 SDK、无承诺最低消费。每个模型的 per-1M-token 价格在 /pricing 页直接公示，与上游官方价随时可对比。
是。我们实现了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models、/v1/video/generations 等完整 OpenAI 端点。Streaming、function calling、vision、tool use 全部行为一致。已经在用 OpenAI SDK 的项目改一行 base_url 即可迁移。
永不过期。Kunavo 是按调用扣费的预付钱包模式，余额永久保留，没有月费、没有最低消费、没有有效期限制。账户注销时余额按原支付方式退回。
不会。4xx 和 5xx 响应一律不计费。流式响应在中途断开时，只扣已生成部分。所有扣费在控制台「用量明细」按调用查看，支持导出 CSV 用于对账。
Stripe 支持的全部方式：信用卡（Visa、Mastercard、Amex、JCB、银联）、Apple Pay、Google Pay、Link、ACH、SEPA、BACS、BECS、Alipay、微信支付、Klarna、Afterpay 等。自动充值可按需开启。企业客户可申请月度发票（Net 30）。
边缘网关节点部署在北美、欧洲、亚太多个区域。无状态路由逻辑在边缘执行，全球 P50 时延 120ms 以内。账单数据、账户和审计日志存储于主区域并多区域复制。

3 分钟，完成第一次调用。

一个 OpenAI 兼容 API 接入 Claude、Gemini、GPT-Image 等 200+ 模型，$5 起充、按量计费，只为真实调用付费。

开始使用阅读快速接入指南