Modelli Prezzi Documentazione Guide Casi d'uso Confronta Chi siamo

Novità — Gemini 3, Claude Opus 4.7, Veo 3 ora live

Modelli frontiera,
30–70 % sotto il prezzo ufficiale.

I modelli frontiera di OpenAI, Anthropic e Google — Claude, Gemini, GPT-Image, Veo — tutti al 30–70 % di sconto sul prezzo ufficiale, dietro una sola API compatibile con OpenAI. Cambia una riga di base_url e sei in produzione.

Inizia ora Leggi la doc

Setup in 5 secondi · Senza carta · Senza minimo

Incolla nel tuo AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Provider integrati

OpenAIAnthropicGoogle

30–70 %

Sotto il prezzo ufficiale

3.200+

Sviluppatori attivi

240 Mln+

Chiamate API al mese

99,95 %

SLA di uptime

<120 ms

Latenza P50

200+

Modelli disponibili

Perché Kunavo

Il gateway AI per i dev che spediscono.

Dal livello di routing al registro di fatturazione, ogni strato di Kunavo è pensato per sviluppatori indie e piccoli team che portano funzionalità AI a utenti veri.

Edge gateway globale

Routing Anycast multi-regione con terminazione TLS al bordo. P50 sotto 120 ms da Nord America, UE o APAC.

Compatibile con OpenAI

Sostituzione drop-in per l'SDK OpenAI. Streaming, function calling, tool use, vision — tutto compatibile a livello di protocollo. Nessun nuovo client da imparare.

Fatturazione nativa Stripe

Carte, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — tutti i metodi Stripe. Ricarica self-service, auto-ricarica, fatturazione automatica.

Modelli frontiera, 30–70 % più economici

Ogni modello di OpenAI, Anthropic e Google al prezzo di listino ufficiale meno 30–70 %. Claude, Gemini, GPT-Image, Veo — testo, immagine, video in un'unica fattura.

Prezzi trasparenti

Prezzo per 1M di token pubblicato per ogni modello. Niente moltiplicatori nascosti, niente sorprese, le richieste fallite non vengono addebitate.

99,95 % SLA

Failover multi-provider in meno di 50 ms. Quando un upstream vacilla, la tua richiesta viene reinoltrata prima che tu te ne accorga.

Streaming di prima classe

Implementazione SSE passthrough nativa. Time-to-first-token identico all'upstream — niente buffering, niente batching, nessuna latenza aggiunta.

Utilizzo granulare

Analytics call-by-call per modello, chiave, IP. Webhook di eventi di utilizzo. Esporta tutto in CSV quando vuoi.

Prompt caching, fino al 90 % in meno

Le letture di cache di Anthropic sono fatturate al 10 % della tariffa di input — passa cache_control nel tuo system prompt e i contesti lunghi diventano riletture quasi gratuite. Hit rate e risparmio in tempo reale nel dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Catalogo modelli

Modelli frontiera, 30–70 % sotto il prezzo ufficiale.

Vedi il catalogo completo

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Per AI agent

Punta il tuo agent a `llms.txt`
e funziona da solo.

Dai a Claude Code, Cursor, Cline — o a qualsiasi agent compatibile con OpenAI — una sola istruzione. Carica il catalogo modelli live di Kunavo e gestisce modelli di testo, immagine e video in autonomia. Nessun SDK, nessun glue code.

Compatibile con il protocollo OpenAI — gli agent non hanno bisogno di integrazione custom
GET /v1/models è il catalogo live — non hardcodare mai i nomi dei modelli
Una chiave, tutte le modalità: testo, immagine, video, audio

Incolla nel tuo AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Ricarica e risparmia

Più ricarichi in anticipo, più risparmi.

Wallet prepagato. Da $10. Senza abbonamento, senza minimo, il credito non scade mai.

Starter

Primi test

$10

Accesso a tutti i modelli
Analytics call-by-call
Supporto community ed email
Senza minimo, senza carta

Registrati gratis

Most popular

Builder

Limitato · +$10

Stai costruendo un prodotto

$100

$110 di credito con $100 ricaricati
10 chiavi API separate
Auto-ricarica · IP allowlist
Supporto email prioritario

Scale

Limitato · +$250

Traffico in produzione

$1000

$1.250 di credito con $1.000 ricaricati
Chiavi API illimitate
Webhook · Fatture mensili
Supporto dedicato Slack/Discord

Enterprise

Limitato · +$2000

Grande scala

$5000

$7.000 di credito con $5.000 ricaricati
Tutto Scale + altro
Rate limit e SLA personalizzati
Account manager dedicato

Vedi la tabella prezzi completa

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Tutto quello
che ti chiedi.

Non hai trovato la risposta? Scrivi a contact@kunavo.com — rispondiamo entro 24 ore.

Kunavo è costruito specificamente per sviluppatori indie e piccoli team che spediscono feature AI in produzione. Tre differenze reali: (1) copriamo testo, immagine e video in una sola fattura — molti aggregatori sono solo testo; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay tutto incluso — nessuna fattura fuori piattaforma; (3) totale trasparenza nel routing — non sostituiamo mai silenziosamente il tuo modello con uno più economico.
Ogni modello è circa il 30–70 % sotto il prezzo di listino ufficiale del provider — e le ricariche grandi sbloccano un bonus aggiuntivo. Risparmi anche operativamente: un contratto, una fattura, un SDK, nessun minimo di impegno. Il prezzo per 1M di token di ogni modello è pubblicato su /pricing — confrontabile con il listing upstream in qualsiasi momento.
Sì. Implementiamo l'intero set di endpoint OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models e /v1/video/generations. Streaming, function calling, vision e tool use si comportano in modo identico. I progetti che usano l'SDK OpenAI migrano cambiando base_url — fine.
No. Kunavo è un wallet prepagato. Le ricariche restano sul tuo account per sempre — niente abbonamenti, niente minimi mensili, niente scadenza. La chiusura dell'account rimborsa il saldo residuo sul metodo di pagamento originale.
Mai. Le risposte 4xx e 5xx non vengono fatturate. Le risposte in streaming che si scollegano a metà vengono addebitate solo per i token effettivamente consegnati. Ogni addebito è visibile call-by-call nel dashboard di utilizzo, esportabile in CSV per la contabilità.
Tutto ciò che supporta Stripe: carte (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay e altro. L'auto-ricarica è opt-in. I clienti Enterprise possono pagare su fattura con termini Net 30.
I nodi edge gateway sono distribuiti in Nord America, Europa e Asia-Pacifico. La logica di routing stateless gira al bordo per una latenza P50 sotto i 120 ms. I dati di fatturazione, account e log di audit sono memorizzati in una regione primaria con replicazione multi-regione.

Tre minuti alla tua prima chiamata.

Un'unica API compatibile con OpenAI per Claude, Gemini, GPT-Image e 200+ altri — ricarica minima di $5, paghi solo per ciò che chiami.

Inizia ora Leggi il quickstart