Modelli frontiera,
30 % sotto il prezzo ufficiale.
I modelli frontiera di OpenAI, Anthropic e Google — Claude, Gemini, GPT-Image, Veo — tutti al 30 % di sconto sul prezzo ufficiale, dietro una sola API compatibile con OpenAI. Cambia una riga di base_url e sei in produzione.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Provider integrati
Il gateway AI per i dev che spediscono.
Dal livello di routing al registro di fatturazione, ogni strato di Kunavo è pensato per sviluppatori indie e piccoli team che portano funzionalità AI a utenti veri.
Edge gateway globale
Routing Anycast multi-regione con terminazione TLS al bordo. P50 sotto 120 ms da Nord America, UE o APAC.
Compatibile con OpenAI
Sostituzione drop-in per l'SDK OpenAI. Streaming, function calling, tool use, vision — tutto compatibile a livello di protocollo. Nessun nuovo client da imparare.
Fatturazione nativa Stripe
Carte, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — tutti i metodi Stripe. Ricarica self-service, auto-ricarica, fatturazione automatica.
Modelli frontiera, 30 % più economici
Ogni modello di OpenAI, Anthropic e Google al prezzo di listino ufficiale meno 30 %. Claude, Gemini, GPT-Image, Veo — testo, immagine, video in un'unica fattura.
Prezzi trasparenti
Prezzo per 1M di token pubblicato per ogni modello. Niente moltiplicatori nascosti, niente sorprese, le richieste fallite non vengono addebitate.
99,95 % SLA
Failover multi-provider in meno di 50 ms. Quando un upstream vacilla, la tua richiesta viene reinoltrata prima che tu te ne accorga.
Streaming di prima classe
Implementazione SSE passthrough nativa. Time-to-first-token identico all'upstream — niente buffering, niente batching, nessuna latenza aggiunta.
Utilizzo granulare
Analytics call-by-call per modello, chiave, IP. Webhook di eventi di utilizzo. Esporta tutto in CSV quando vuoi.
Prompt caching, fino al 90 % in meno
Le letture di cache di Anthropic sono fatturate al 10 % della tariffa di input — passa cache_control nel tuo system prompt e i contesti lunghi diventano riletture quasi gratuite. Hit rate e risparmio in tempo reale nel dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Modelli frontiera, 30 % sotto il prezzo ufficiale.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
Punta il tuo agent a llms.txt
e funziona da solo.
Dai a Claude Code, Cursor, Cline — o a qualsiasi agent compatibile con OpenAI — una sola istruzione. Carica il catalogo modelli live di Kunavo e gestisce modelli di testo, immagine e video in autonomia. Nessun SDK, nessun glue code.
- Compatibile con il protocollo OpenAI — gli agent non hanno bisogno di integrazione custom
- GET /v1/models è il catalogo live — non hardcodare mai i nomi dei modelli
- Una chiave, tutte le modalità: testo, immagine, video, audio
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Più ricarichi in anticipo, più risparmi.
Wallet prepagato. Da $10. Senza abbonamento, senza minimo, il credito non scade mai.
Starter
Primi test
- Accesso a tutti i modelli
- Analytics call-by-call
- Supporto community ed email
- Senza minimo, senza carta
Builder
Limitato · +$10Stai costruendo un prodotto
- $110 di credito con $100 ricaricati
- 10 chiavi API separate
- Auto-ricarica · IP allowlist
- Supporto email prioritario
Scale
Limitato · +$250Traffico in produzione
- $1.250 di credito con $1.000 ricaricati
- Chiavi API illimitate
- Webhook · Fatture mensili
- Supporto dedicato Slack/Discord
Enterprise
Limitato · +$2000Grande scala
- $7.000 di credito con $5.000 ricaricati
- Tutto Scale + altro
- Rate limit e SLA personalizzati
- Account manager dedicato
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Tutto quello
che ti chiedi.
Non hai trovato la risposta? Scrivi a contact@kunavo.com — rispondiamo entro 24 ore.
Kunavo è costruito specificamente per sviluppatori indie e piccoli team che spediscono feature AI in produzione. Tre differenze reali: (1) copriamo testo, immagine e video in una sola fattura — molti aggregatori sono solo testo; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay tutto incluso — nessuna fattura fuori piattaforma; (3) totale trasparenza nel routing — non sostituiamo mai silenziosamente il tuo modello con uno più economico.
Ogni modello è circa il 30 % sotto il prezzo di listino ufficiale del provider — e le ricariche grandi sbloccano un bonus aggiuntivo. Risparmi anche operativamente: un contratto, una fattura, un SDK, $2 di credito iniziale, nessun minimo di impegno. Il prezzo per 1M di token di ogni modello è pubblicato su /pricing — confrontabile con il listing upstream in qualsiasi momento.
Sì. Implementiamo l'intero set di endpoint OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models e /v1/video/generations. Streaming, function calling, vision e tool use si comportano in modo identico. I progetti che usano l'SDK OpenAI migrano cambiando base_url — fine.
No. Kunavo è un wallet prepagato. Le ricariche restano sul tuo account per sempre — niente abbonamenti, niente minimi mensili, niente scadenza. La chiusura dell'account rimborsa il saldo residuo sul metodo di pagamento originale.
Mai. Le risposte 4xx e 5xx non vengono fatturate. Le risposte in streaming che si scollegano a metà vengono addebitate solo per i token effettivamente consegnati. Ogni addebito è visibile call-by-call nel dashboard di utilizzo, esportabile in CSV per la contabilità.
Tutto ciò che supporta Stripe: carte (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay e altro. L'auto-ricarica è opt-in. I clienti Enterprise possono pagare su fattura con termini Net 30.
I nodi edge gateway sono distribuiti in Nord America, Europa e Asia-Pacifico. La logica di routing stateless gira al bordo per una latenza P50 sotto i 120 ms. I dati di fatturazione, account e log di audit sono memorizzati in una regione primaria con replicazione multi-regione.
Tre minuti alla tua prima chiamata.
La registrazione ti dà $2 di credito — abbastanza per mettere alla prova Claude, Gemini e GPT-Image. Senza carta.