Model Harga Dokumentasi Panduan Kasus penggunaan Bandingkan Tentang

Baru — Gemini 3, Claude Opus 4.7, Veo 3 kini tersedia

Model frontier,
30–70% lebih murah dari harga resmi.

Model frontier dari OpenAI, Anthropic, dan Google — Claude, Gemini, GPT-Image, Veo — semuanya dengan diskon 30–70% dari harga resmi, di balik API yang kompatibel dengan OpenAI. Ubah satu baris base_url dan kamu langsung di produksi.

Mulai Baca dokumen

Pengaturan 5 detik · Tanpa kartu · Tanpa minimum

Tempel ini ke AI agent kamu

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Penyedia terintegrasi

OpenAIAnthropicGoogle

30–70%

Di bawah harga resmi

3.200+

Developer aktif

240 jt+

Panggilan API per bulan

99,95%

SLA ketersediaan

<120 ms

Latensi P50

200+

Model tersedia

Mengapa Kunavo

Gateway AI untuk developer yang merilis ke produksi.

Dari lapisan routing hingga ledger penagihan, setiap lapisan Kunavo dirancang untuk developer independen dan tim kecil yang menghadirkan fitur AI ke pengguna sungguhan.

Edge gateway global

Routing Anycast multi-region dengan terminasi TLS di edge. P50 di bawah 120 ms dari Amerika Utara, UE, atau APAC.

Kompatibel dengan OpenAI

Pengganti drop-in untuk SDK OpenAI. Streaming, function calling, tool use, vision — semuanya kompatibel di level protokol. Tak ada klien baru yang perlu dipelajari.

Penagihan native Stripe

Kartu, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — semua metode Stripe. Top-up self-service, auto top-up, faktur otomatis.

Model frontier, 30–70% lebih murah

Setiap model dari OpenAI, Anthropic, dan Google dengan harga resmi dikurangi 30–70%. Claude, Gemini, GPT-Image, Veo — teks, gambar, dan video dalam satu tagihan.

Harga transparan

Tarif per juta token dipublikasikan untuk setiap model. Tanpa pengali tersembunyi, tanpa kejutan, request yang gagal tidak ditagih.

SLA 99,95%

Failover multi-penyedia dalam kurang dari 50 ms. Saat satu upstream goyah, request kamu dialihkan ulang sebelum kamu menyadarinya.

Streaming kelas satu

Implementasi SSE passthrough native. Time-to-first-token identik dengan upstream — tanpa buffering, tanpa batching, tanpa latensi tambahan.

Penggunaan granular

Analytics per panggilan untuk tiap model, tiap key, tiap IP. Webhook untuk event penggunaan. Ekspor semuanya ke CSV kapan pun kamu mau.

Prompt caching, hingga 90% lebih murah

Baca cache Anthropic ditagih 10% dari harga input — kirim cache_control di system prompt kamu dan konteks panjang menjadi pembacaan ulang yang nyaris gratis. Hit rate dan penghematan real-time di dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Katalog model

Model frontier, 30–70% di bawah harga resmi.

Lihat katalog lengkap

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 5

Near-flagship Opus reasoning at half the price of Fable 5 — vision, agentic coding, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 5 Fast

Opus 5 tuned for latency — same frontier reasoning, faster output, 200K context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 3.6 Flash

Google's newest Flash — thinking-by-default at Flash latency, 1M context, native audio input.

visionfunctionstreamingthinking

$1.5 / $7.5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.6 Sol

OpenAI's newest flagship — top-tier reasoning and agentic coding, 1.05M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Untuk AI agent

Arahkan agent kamu ke `llms.txt`
dan ia berjalan sendiri.

Beri Claude Code, Cursor, Cline — atau agent apa pun yang kompatibel dengan OpenAI — satu instruksi saja. Ia akan memuat katalog model live Kunavo dan mengoperasikan model teks, gambar, serta video secara mandiri. Tanpa SDK, tanpa glue code.

Kompatibel dengan protokol OpenAI — agent tidak butuh integrasi khusus
GET /v1/models adalah katalog live — jangan pernah hardcode nama model
Satu key, semua modalitas: teks, gambar, video, audio

Tempel ini ke AI agent kamu

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Top-up dan hemat

Semakin banyak kamu top-up di muka, semakin besar hematmu.

Dompet prabayar. Mulai dari $10. Tanpa langganan, tanpa minimum, saldo tidak kedaluwarsa.

Starter

Uji coba pertama

$10

Akses ke semua model
Analytics per panggilan
Dukungan komunitas dan email
Tanpa minimum, tanpa kartu

Most popular

Builder

Terbatas · +$10

Kamu sedang membangun produk

$100

Kredit $110 untuk top-up $100
10 API key independen
Auto top-up · Daftar IP yang diizinkan
Dukungan email prioritas

Scale

Terbatas · +$250

Trafik produksi

$1000

Kredit $1.250 untuk top-up $1.000
API key tanpa batas
Webhook · Faktur bulanan
Dukungan khusus Slack/Discord

Enterprise

Terbatas · +$2000

Skala besar

$5000

Kredit $7.000 untuk top-up $5.000
Semua fitur Scale + lebih
Rate limit dan SLA khusus
Account manager khusus

Lihat tabel harga lengkap

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Semua yang
kamu tanyakan.

Tidak menemukan jawaban? Tulis ke contact@kunavo.com — kami balas dalam 24 jam.

Kunavo dirancang khusus untuk developer indie dan tim kecil yang merilis fitur AI ke produksi. Tiga perbedaan nyata: (1) kami mencakup teks, gambar, dan video dalam satu tagihan — banyak agregator hanya teks; (2) checkout native Stripe, ACH, SEPA, Apple Pay, WeChat Pay semua termasuk — tanpa faktur di luar platform; (3) transparansi penuh dalam routing — kami tidak pernah diam-diam mengganti modelmu dengan yang lebih murah.
Setiap model sekitar 30–70% di bawah harga resmi penyedia — dan top-up besar menambah bonus ekstra. Kamu juga hemat di operasional: satu kontrak, satu tagihan, satu SDK, tanpa komitmen minimum. Harga per juta token tiap model dipublikasikan di /pricing — bisa dibandingkan dengan listing upstream kapan saja.
Ya. Kami mengimplementasikan rangkaian lengkap endpoint OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models, dan /v1/video/generations. Streaming, function calling, vision, dan tool use berperilaku identik. Proyek yang memakai SDK OpenAI bermigrasi cukup dengan mengubah base_url — hanya itu.
Tidak. Kunavo adalah dompet prabayar. Top-up tetap di akunmu selamanya — tanpa langganan, tanpa minimum bulanan, tanpa kedaluwarsa. Penutupan akun mengembalikan sisa saldo ke metode pembayaran asli.
Tidak pernah. Respons 4xx dan 5xx tidak ditagih. Respons streaming yang terputus di tengah jalan hanya ditagih untuk token yang benar-benar terkirim. Setiap biaya terlihat per panggilan di dashboard penggunaan, bisa diekspor ke CSV untuk pembukuan.
Semua yang didukung Stripe: kartu (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay, dan lainnya. Auto top-up bersifat opt-in. Pelanggan Enterprise bisa membayar lewat faktur dengan syarat Net 30.
Node edge tersebar di Amerika Utara, Eropa, dan Asia-Pasifik. Logika routing stateless berjalan di edge untuk latensi P50 di bawah 120 ms. Data penagihan, akun, dan log audit disimpan di satu region utama dengan replikasi multi-region.

Tiga menit menuju panggilan pertamamu.

Satu API kompatibel OpenAI untuk Claude, Gemini, GPT-Image, dan 200+ model lainnya — top-up minimal $5, kamu hanya bayar untuk yang kamu panggil.

Mulai Baca quickstart