Model frontier,
30–70% lebih murah dari harga resmi.
Model frontier dari OpenAI, Anthropic, dan Google — Claude, Gemini, GPT-Image, Veo — semuanya dengan diskon 30–70% dari harga resmi, di balik API yang kompatibel dengan OpenAI. Ubah satu baris base_url dan kamu langsung di produksi.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Penyedia terintegrasi
Gateway AI untuk developer yang merilis ke produksi.
Dari lapisan routing hingga ledger penagihan, setiap lapisan Kunavo dirancang untuk developer independen dan tim kecil yang menghadirkan fitur AI ke pengguna sungguhan.
Edge gateway global
Routing Anycast multi-region dengan terminasi TLS di edge. P50 di bawah 120 ms dari Amerika Utara, UE, atau APAC.
Kompatibel dengan OpenAI
Pengganti drop-in untuk SDK OpenAI. Streaming, function calling, tool use, vision — semuanya kompatibel di level protokol. Tak ada klien baru yang perlu dipelajari.
Penagihan native Stripe
Kartu, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — semua metode Stripe. Top-up self-service, auto top-up, faktur otomatis.
Model frontier, 30–70% lebih murah
Setiap model dari OpenAI, Anthropic, dan Google dengan harga resmi dikurangi 30–70%. Claude, Gemini, GPT-Image, Veo — teks, gambar, dan video dalam satu tagihan.
Harga transparan
Tarif per juta token dipublikasikan untuk setiap model. Tanpa pengali tersembunyi, tanpa kejutan, request yang gagal tidak ditagih.
SLA 99,95%
Failover multi-penyedia dalam kurang dari 50 ms. Saat satu upstream goyah, request kamu dialihkan ulang sebelum kamu menyadarinya.
Streaming kelas satu
Implementasi SSE passthrough native. Time-to-first-token identik dengan upstream — tanpa buffering, tanpa batching, tanpa latensi tambahan.
Penggunaan granular
Analytics per panggilan untuk tiap model, tiap key, tiap IP. Webhook untuk event penggunaan. Ekspor semuanya ke CSV kapan pun kamu mau.
Prompt caching, hingga 90% lebih murah
Baca cache Anthropic ditagih 10% dari harga input — kirim cache_control di system prompt kamu dan konteks panjang menjadi pembacaan ulang yang nyaris gratis. Hit rate dan penghematan real-time di dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Model frontier, 30–70% di bawah harga resmi.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
GPT-5.4
OpenAI GPT-5.4 — strong general reasoning, 1M context.
GPT-5.5
OpenAI GPT-5.5 — flagship reasoning, 1M context.
GPT-5.4 Mini
OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.
GPT-5.3 Codex
OpenAI GPT-5.3 Codex — coding-specialized.
GPT-5.5 Pro
OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.
Arahkan agent kamu ke llms.txt
dan ia berjalan sendiri.
Beri Claude Code, Cursor, Cline — atau agent apa pun yang kompatibel dengan OpenAI — satu instruksi saja. Ia akan memuat katalog model live Kunavo dan mengoperasikan model teks, gambar, serta video secara mandiri. Tanpa SDK, tanpa glue code.
- Kompatibel dengan protokol OpenAI — agent tidak butuh integrasi khusus
- GET /v1/models adalah katalog live — jangan pernah hardcode nama model
- Satu key, semua modalitas: teks, gambar, video, audio
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Semakin banyak kamu top-up di muka, semakin besar hematmu.
Dompet prabayar. Mulai dari $10. Tanpa langganan, tanpa minimum, saldo tidak kedaluwarsa.
Starter
Uji coba pertama
- Akses ke semua model
- Analytics per panggilan
- Dukungan komunitas dan email
- Tanpa minimum, tanpa kartu
Builder
Terbatas · +$10Kamu sedang membangun produk
- Kredit $110 untuk top-up $100
- 10 API key independen
- Auto top-up · Daftar IP yang diizinkan
- Dukungan email prioritas
Scale
Terbatas · +$250Trafik produksi
- Kredit $1.250 untuk top-up $1.000
- API key tanpa batas
- Webhook · Faktur bulanan
- Dukungan khusus Slack/Discord
Enterprise
Terbatas · +$2000Skala besar
- Kredit $7.000 untuk top-up $5.000
- Semua fitur Scale + lebih
- Rate limit dan SLA khusus
- Account manager khusus
Start with the popular guides.
- Setup
Gemini API key
Get a Gemini key and call it with the OpenAI SDK — or use one Kunavo key for everything.
Read - Setup
Claude API key
Get a Claude key and call Claude via the OpenAI SDK or the native Messages API.
Read - Pricing
Claude API pricing 2026
Per-model rates ~60% under Anthropic, worked cost examples, and prompt-caching savings.
Read - Pricing
Gemini API pricing 2026
Gemini 2.5 rates ~70% under Google's list, with worked cost examples.
Read - Video
Sora API & video generation
Text-to-video on an OpenAI-style endpoint — live today on Google Veo 3.
Read - Compare
Kunavo vs OpenRouter
Where each wins: text breadth vs multimodal, pricing, API keys and payments.
Read
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 為台灣品牌做短影片廣告(Sora 同端點待上線)— 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Semua yang
kamu tanyakan.
Tidak menemukan jawaban? Tulis ke contact@kunavo.com — kami balas dalam 24 jam.
Kunavo dirancang khusus untuk developer indie dan tim kecil yang merilis fitur AI ke produksi. Tiga perbedaan nyata: (1) kami mencakup teks, gambar, dan video dalam satu tagihan — banyak agregator hanya teks; (2) checkout native Stripe, ACH, SEPA, Apple Pay, WeChat Pay semua termasuk — tanpa faktur di luar platform; (3) transparansi penuh dalam routing — kami tidak pernah diam-diam mengganti modelmu dengan yang lebih murah.
Setiap model sekitar 30–70% di bawah harga resmi penyedia — dan top-up besar menambah bonus ekstra. Kamu juga hemat di operasional: satu kontrak, satu tagihan, satu SDK, tanpa komitmen minimum. Harga per juta token tiap model dipublikasikan di /pricing — bisa dibandingkan dengan listing upstream kapan saja.
Ya. Kami mengimplementasikan rangkaian lengkap endpoint OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models, dan /v1/video/generations. Streaming, function calling, vision, dan tool use berperilaku identik. Proyek yang memakai SDK OpenAI bermigrasi cukup dengan mengubah base_url — hanya itu.
Tidak. Kunavo adalah dompet prabayar. Top-up tetap di akunmu selamanya — tanpa langganan, tanpa minimum bulanan, tanpa kedaluwarsa. Penutupan akun mengembalikan sisa saldo ke metode pembayaran asli.
Tidak pernah. Respons 4xx dan 5xx tidak ditagih. Respons streaming yang terputus di tengah jalan hanya ditagih untuk token yang benar-benar terkirim. Setiap biaya terlihat per panggilan di dashboard penggunaan, bisa diekspor ke CSV untuk pembukuan.
Semua yang didukung Stripe: kartu (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay, dan lainnya. Auto top-up bersifat opt-in. Pelanggan Enterprise bisa membayar lewat faktur dengan syarat Net 30.
Node edge tersebar di Amerika Utara, Eropa, dan Asia-Pasifik. Logika routing stateless berjalan di edge untuk latensi P50 di bawah 120 ms. Data penagihan, akun, dan log audit disimpan di satu region utama dengan replikasi multi-region.
Tiga menit menuju panggilan pertamamu.
Satu API kompatibel OpenAI untuk Claude, Gemini, GPT-Image, dan 200+ model lainnya — top-up minimal $5, kamu hanya bayar untuk yang kamu panggil.