前沿模型,
一律官方价 7 折。
OpenAI、Anthropic、Google 三大实验室的前沿模型 —— Claude、Gemini、GPT-Image、Veo —— 每一个都按官方价 7 折结算,统一收进一个 OpenAI 兼容 API。改一行 base_url 即可上线。
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
已聚合的供应商
为出海开发者构建的 AI 网关。
从路由层到账本,每一层都为「独立开发者和小团队把 AI 功能交付给真实用户」这件事重新设计。
全球边缘网关
多区域 Anycast 路由 + 边缘 TLS 终止。北美、欧洲、亚太任意地区 P50 时延低于 120ms。
OpenAI 兼容
OpenAI SDK 的 drop-in 替代。Streaming、function calling、tool use、vision 全部线协议兼容,无需学习新 client。
Stripe 原生计费
信用卡、Apple Pay、Google Pay、ACH、SEPA、Alipay、微信 Pay —— Stripe 支持的方式我们都支持。自助充值、自动续费、发票全自动。
前沿模型,官方 7 折
OpenAI、Anthropic、Google 的每一个模型,都按官方挂牌价 7 折计费。Claude、Gemini、GPT-Image、Veo —— 文本、图像、视频,一份账单。
透明定价
每个模型的 per-1M-token 价格全部公示。无隐藏乘数、无意外溢价、失败请求不计费。
99.95% SLA
多供应商热备 + 50ms 内自动故障切换。任一上游抖动,请求在你察觉之前就被改写到备用通道。
原生流式
SSE pass-through 实现。首字 token 时间与上游官方一致 —— 不缓冲、不批处理、零延迟。
精细化用量
按模型、API key、IP 维度的调用级分析 + Webhook 事件推送。CSV 一键导出,便于业务对账。
Prompt 缓存,最高省 90%
Anthropic 模型缓存命中按 10% 输入价计费 —— 在 system prompt 上加 cache_control,长上下文重复读取近乎免费。命中率与节省金额在控制台实时可见。
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
前沿模型,一律官方 7 折
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
把你的 Agent 指向 llms.txt
它就能用上每个模型。
把一句话交给 Claude Code、Cursor、Cline 或任何 OpenAI 兼容的 Agent。它会自己读取 Kunavo 的实时模型目录,驱动文本、图像、视频模型。无需 SDK,无需胶水代码。
- OpenAI 线协议兼容 —— Agent 无需任何定制接入
- GET /v1/models 即实时目录 —— 无需硬编码模型名
- 一把密钥贯通全模态:文本、图像、视频、音频
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
按量付费,多充多得
预付钱包模式。$10 起步,无月费、无最低消费、余额永不过期。
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Kunavo 专门为独立开发者和小团队的生产级 AI 功能设计。三个真实差异:(1) 文本、图像、视频统一计费 —— 大部分聚合平台只做文本;(2) Stripe 原生结账,ACH、SEPA、Apple Pay、微信支付全部支持,无需走线下发票;(3) 路由完全透明 —— 我们绝不偷换你的模型到更便宜的版本。
每个模型价格约为官方挂牌价的 7 折(立省约 30%),充值越多额外赠送越多。再加上运营层面的省心:一份合同、一份发票、一套 SDK、$2 注册送、无承诺最低消费。每个模型的 per-1M-token 价格在 /pricing 页直接公示,与上游官方价随时可对比。
是。我们实现了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models、/v1/video/generations 等完整 OpenAI 端点。Streaming、function calling、vision、tool use 全部行为一致。已经在用 OpenAI SDK 的项目改一行 base_url 即可迁移。
永不过期。Kunavo 是按调用扣费的预付钱包模式,余额永久保留,没有月费、没有最低消费、没有有效期限制。账户注销时余额按原支付方式退回。
不会。4xx 和 5xx 响应一律不计费。流式响应在中途断开时,只扣已生成部分。所有扣费在控制台「用量明细」按调用查看,支持导出 CSV 用于对账。
Stripe 支持的全部方式:信用卡(Visa、Mastercard、Amex、JCB、银联)、Apple Pay、Google Pay、Link、ACH、SEPA、BACS、BECS、Alipay、微信支付、Klarna、Afterpay 等。自动充值可按需开启。企业客户可申请月度发票(Net 30)。
边缘网关节点部署在北美、欧洲、亚太多个区域。无状态路由逻辑在边缘执行,全球 P50 时延 120ms 以内。账单数据、账户和审计日志存储于主区域并多区域复制。