Mô hình tiên phong,
rẻ hơn 30–70% so với giá chính thức.
Các mô hình tiên phong từ OpenAI, Anthropic và Google — Claude, Gemini, GPT-Image, Veo — tất cả đều giảm 30–70% so với giá chính thức, sau một API tương thích với OpenAI. Đổi một dòng base_url và bạn đã lên production.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Nhà cung cấp đã tích hợp
Gateway AI cho lập trình viên đưa sản phẩm lên production.
Từ lớp routing đến sổ cái thanh toán, mỗi lớp của Kunavo đều được thiết kế cho lập trình viên độc lập và đội nhỏ đang mang tính năng AI đến người dùng thật.
Edge gateway toàn cầu
Routing Anycast đa vùng với kết thúc TLS tại edge. P50 dưới 120 ms từ Bắc Mỹ, EU hay APAC.
Tương thích với OpenAI
Thay thế drop-in cho SDK OpenAI. Streaming, function calling, tool use, vision — tất cả tương thích ở cấp giao thức. Không cần học client mới.
Thanh toán native Stripe
Thẻ, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — mọi phương thức của Stripe. Nạp tiền tự phục vụ, tự động nạp, lập hóa đơn tự động.
Mô hình tiên phong, rẻ hơn 30–70%
Mọi mô hình từ OpenAI, Anthropic và Google với giá chính thức trừ 30–70%. Claude, Gemini, GPT-Image, Veo — văn bản, hình ảnh và video trong một hóa đơn.
Giá minh bạch
Mức giá trên mỗi triệu token được công bố cho từng mô hình. Không có hệ số nhân ẩn, không bất ngờ, request thất bại không bị tính phí.
SLA 99,95%
Failover đa nhà cung cấp trong dưới 50 ms. Khi một upstream chệch choạc, request của bạn được định tuyến lại trước khi bạn kịp nhận ra.
Streaming hạng nhất
Triển khai SSE passthrough native. Time-to-first-token giống hệt upstream — không buffering, không batching, không thêm độ trễ.
Mức dùng chi tiết
Analytics theo từng lượt gọi cho mỗi mô hình, mỗi key, mỗi IP. Webhook cho sự kiện sử dụng. Xuất tất cả ra CSV bất cứ khi nào bạn muốn.
Prompt caching, rẻ tới 90%
Đọc cache của Anthropic được tính 10% giá input — truyền cache_control trong system prompt của bạn và những ngữ cảnh dài trở thành các lần đọc lại gần như miễn phí. Hit rate và mức tiết kiệm theo thời gian thực trên dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Mô hình tiên phong, dưới giá chính thức 30–70%.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
GPT-5.4
OpenAI GPT-5.4 — strong general reasoning, 1M context.
GPT-5.5
OpenAI GPT-5.5 — flagship reasoning, 1M context.
GPT-5.4 Mini
OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.
GPT-5.3 Codex
OpenAI GPT-5.3 Codex — coding-specialized.
GPT-5.5 Pro
OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.
Trỏ agent của bạn tới llms.txt
và nó tự chạy.
Hãy đưa cho Claude Code, Cursor, Cline — hay bất kỳ agent nào tương thích OpenAI — một chỉ dẫn duy nhất. Nó sẽ tải danh mục mô hình trực tiếp của Kunavo và vận hành các mô hình văn bản, hình ảnh, video một cách tự chủ. Không SDK, không glue code.
- Tương thích với giao thức OpenAI — agent không cần tích hợp tùy chỉnh
- GET /v1/models là danh mục trực tiếp — đừng bao giờ hardcode tên mô hình
- Một key, mọi phương thức: văn bản, hình ảnh, video, âm thanh
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Nạp trước càng nhiều, tiết kiệm càng lớn.
Ví trả trước. Từ $10. Không đăng ký định kỳ, không yêu cầu tối thiểu, số dư không hết hạn.
Starter
Thử nghiệm đầu tiên
- Truy cập tất cả mô hình
- Analytics theo từng lượt gọi
- Hỗ trợ cộng đồng và email
- Không tối thiểu, không cần thẻ
Builder
Giới hạn · +$10Bạn đang xây dựng một sản phẩm
- $110 tín dụng cho mỗi $100 nạp vào
- 10 API key độc lập
- Tự động nạp · Danh sách IP được phép
- Hỗ trợ email ưu tiên
Scale
Giới hạn · +$250Lưu lượng production
- $1.250 tín dụng cho mỗi $1.000 nạp vào
- API key không giới hạn
- Webhook · Hóa đơn hàng tháng
- Hỗ trợ riêng qua Slack/Discord
Enterprise
Giới hạn · +$2000Quy mô lớn
- $7.000 tín dụng cho mỗi $5.000 nạp vào
- Toàn bộ Scale + nhiều hơn
- Rate limit và SLA tùy chỉnh
- Account manager riêng
Start with the popular guides.
- Setup
Gemini API key
Get a Gemini key and call it with the OpenAI SDK — or use one Kunavo key for everything.
Read - Setup
Claude API key
Get a Claude key and call Claude via the OpenAI SDK or the native Messages API.
Read - Pricing
Claude API pricing 2026
Per-model rates ~60% under Anthropic, worked cost examples, and prompt-caching savings.
Read - Pricing
Gemini API pricing 2026
Gemini 2.5 rates ~70% under Google's list, with worked cost examples.
Read - Video
Sora API & video generation
Text-to-video on an OpenAI-style endpoint — live today on Google Veo 3.
Read - Compare
Kunavo vs OpenRouter
Where each wins: text breadth vs multimodal, pricing, API keys and payments.
Read
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 為台灣品牌做短影片廣告(Sora 同端點待上線)— 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Mọi điều
bạn đang băn khoăn.
Không tìm thấy câu trả lời? Viết cho chúng tôi tại contact@kunavo.com — chúng tôi phản hồi trong 24 giờ.
Kunavo được thiết kế riêng cho lập trình viên indie và đội nhỏ đưa tính năng AI lên production. Ba khác biệt thực sự: (1) chúng tôi bao phủ văn bản, hình ảnh và video trong một hóa đơn — nhiều bộ tổng hợp chỉ có văn bản; (2) checkout native Stripe, ACH, SEPA, Apple Pay, WeChat Pay đều có sẵn — không hóa đơn ngoài nền tảng; (3) minh bạch hoàn toàn trong routing — chúng tôi không bao giờ âm thầm đổi mô hình của bạn sang loại rẻ hơn.
Mỗi mô hình thấp hơn khoảng 30–70% so với giá chính thức của nhà cung cấp — và các lần nạp lớn còn cộng thêm tiền thưởng. Bạn cũng tiết kiệm về vận hành: một hợp đồng, một hóa đơn, một SDK, không cam kết tối thiểu. Giá trên mỗi triệu token của từng mô hình được công bố tại /pricing — có thể so sánh với bảng niêm yết upstream bất cứ lúc nào.
Có. Chúng tôi triển khai trọn bộ endpoint của OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models và /v1/video/generations. Streaming, function calling, vision và tool use hoạt động y hệt. Các dự án dùng SDK OpenAI chuyển đổi chỉ bằng cách thay base_url — chỉ vậy thôi.
Không. Kunavo là một ví trả trước. Số tiền nạp ở lại trong tài khoản của bạn mãi mãi — không đăng ký định kỳ, không tối thiểu hàng tháng, không hết hạn. Đóng tài khoản sẽ hoàn số dư còn lại về phương thức thanh toán ban đầu.
Không bao giờ. Phản hồi 4xx và 5xx không bị tính phí. Phản hồi streaming bị ngắt giữa chừng chỉ bị tính phí cho những token đã thực sự được gửi đi. Mọi khoản phí đều hiển thị theo từng lượt gọi trên dashboard mức dùng, có thể xuất ra CSV để hạch toán.
Mọi thứ Stripe hỗ trợ: thẻ (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay và nhiều hơn nữa. Tự động nạp là tùy chọn bật. Khách hàng Enterprise có thể thanh toán qua hóa đơn với điều khoản Net 30.
Các node edge được triển khai ở Bắc Mỹ, châu Âu và châu Á - Thái Bình Dương. Logic routing stateless chạy tại edge để đạt độ trễ P50 dưới 120 ms. Dữ liệu thanh toán, tài khoản và log kiểm toán được lưu ở một vùng chính với sao chép đa vùng.
Ba phút đến lượt gọi đầu tiên của bạn.
Một API tương thích OpenAI duy nhất cho Claude, Gemini, GPT-Image và hơn 200 mô hình khác — nạp tối thiểu $5, bạn chỉ trả cho những gì bạn gọi.