Modèles Tarifs Documentation Guides Cas d'usage Comparer À propos

Se connecter Commencer

Nouveau — Gemini 3, Claude Opus 4.7, Veo 3 disponibles

Modèles frontière,
30–70 % sous le tarif officiel.

Les modèles frontière d'OpenAI, Anthropic et Google — Claude, Gemini, GPT-Image, Veo — tous 30–70 % sous le tarif officiel, derrière une seule API compatible OpenAI. Changez une ligne base_url et vous êtes en production.

Commencer Lire la doc

Setup en 5 secondes · Pas de carte requise · Pas de minimum

À coller dans votre AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Fournisseurs intégrés

OpenAIAnthropicGoogle

30–70 %

Sous le tarif officiel

3 200+

Développeurs actifs

240 M+

Appels API par mois

99,95 %

SLA de disponibilité

<120 ms

Latence P50

200+

Modèles disponibles

Pourquoi Kunavo

La passerelle AI pour les devs qui livrent.

De la couche de routage au registre de facturation, chaque couche de Kunavo est conçue pour les développeurs indépendants et les petites équipes qui livrent de l'AI à de vrais utilisateurs.

Passerelle edge globale

Routage Anycast multi-régions avec terminaison TLS au bord. Latence P50 sous 120 ms depuis l'Amérique du Nord, l'UE ou l'APAC.

Compatible OpenAI

Remplacement drop-in du SDK OpenAI. Streaming, function calling, tool use, vision — tout est compatible au niveau du protocole. Aucun nouveau client à apprendre.

Facturation native Stripe

Cartes, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — toutes les méthodes Stripe. Recharge en self-service, auto-recharge, facturation automatique.

Modèles frontière, 30–70 % moins cher

Chaque modèle d'OpenAI, Anthropic et Google au tarif officiel listé moins 30–70 %. Claude, Gemini, GPT-Image, Veo — texte, image, vidéo sur une seule facture.

Tarification transparente

Tarif par million de tokens publié pour chaque modèle. Pas de multiplicateurs cachés, pas de surprises, pas de facturation des requêtes échouées.

SLA 99,95 %

Bascule automatique entre fournisseurs en moins de 50 ms. Quand un upstream vacille, votre requête est reroutée avant que vous ne le remarquiez.

Streaming de classe mondiale

Implémentation native SSE passthrough. Time-to-first-token identique à l'upstream — pas de buffering, pas de batching, pas de latence.

Utilisation détaillée

Analytics call-by-call par modèle, par clé, par IP. Webhooks d'événements d'utilisation. Export CSV de tout, à tout moment.

Prompt caching, jusqu'à 90 % moins cher

Les lectures de cache Anthropic sont facturées à 10 % du tarif d'input — passez cache_control dans votre system prompt et les longs contextes deviennent des re-lectures quasi gratuites. Hit rate et économies visibles en direct dans le dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Catalogue de modèles

Modèles frontière, 30–70 % sous le tarif officiel.

Voir le catalogue complet

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Pour AI agents

Pointez votre agent vers `llms.txt`
et il roule seul.

Donnez à Claude Code, Cursor, Cline — ou tout agent compatible OpenAI — une seule instruction. Il chargera le catalogue de modèles live de Kunavo et pilotera de manière autonome texte, image et vidéo. Pas besoin de SDK ni de glue code.

Compatible avec le protocole OpenAI — aucune intégration custom requise
GET /v1/models est le catalogue live — ne jamais hardcoder les noms de modèles
Une clé, toutes les modalités : texte, image, vidéo, audio

À coller dans votre AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Rechargez et économisez

Plus vous rechargez à l'avance, plus vous économisez.

Portefeuille prépayé. À partir de $10. Pas d'abonnement, pas de minimum, le solde n'expire jamais.

Starter

Premiers tests

$10

Accès à tous les modèles
Analytics call-by-call
Support communautaire & e-mail
Sans minimum, sans carte

Inscription gratuite

Most popular

Builder

Limité · +$10

Vous construisez un produit

$100

$110 de crédit pour $100 rechargés
10 clés API distinctes
Auto-recharge · Whitelist IP
Support e-mail prioritaire

Scale

Limité · +$250

Trafic en production

$1000

$1 250 de crédit pour $1 000 rechargés
Clés API illimitées
Webhooks · Factures mensuelles
Support Slack/Discord dédié

Recharger $1000

Enterprise

Limité · +$2000

Grande échelle

$5000

$7 000 de crédit pour $5 000 rechargés
Tout Scale + plus
Rate limits & SLA personnalisés
Account manager dédié

Recharger $5000

Voir la grille tarifaire complète

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Tout ce que vous
vous demandez.

Pas de réponse à votre question ? Écrivez à contact@kunavo.com — nous répondons sous 24 heures.

Kunavo est conçu pour les développeurs indépendants et les petites équipes qui expédient des fonctionnalités AI en production. Trois vraies différences : (1) nous couvrons texte, image et vidéo sur une seule facture — beaucoup d'agrégateurs ne font que du texte ; (2) checkout natif Stripe, ACH, SEPA, Apple Pay, WeChat Pay tout inclus — aucune facture hors plateforme ; (3) transparence totale du routage — nous ne remplaçons jamais silencieusement votre modèle par un moins cher.
Chaque modèle est tarifé environ 30–70 % sous le prix catalogue officiel du fournisseur — et les recharges importantes débloquent un bonus supplémentaire. Vous économisez aussi en opérations : un contrat, une facture, un SDK, pas de minimum d'engagement. Le tarif par million de tokens de chaque modèle est publié sur /pricing — comparable à tout moment au listing upstream.
Oui. Nous implémentons l'ensemble complet des endpoints OpenAI : /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models et /v1/video/generations. Streaming, function calling, vision et tool use se comportent à l'identique. Les projets utilisant le SDK OpenAI migrent en changeant base_url — c'est tout.
Non. Kunavo est un portefeuille prépayé. Les recharges restent sur votre compte pour toujours — pas d'abonnement, pas de minimum mensuel, pas d'expiration. La fermeture de compte rembourse le solde restant sur le moyen de paiement d'origine.
Jamais. Les réponses 4xx et 5xx ne sont pas facturées. Les réponses streamées qui se déconnectent en cours de route ne sont facturées que sur les tokens effectivement livrés. Chaque charge est visible call-by-call dans le dashboard d'utilisation, exportable en CSV pour la comptabilité.
Tout ce que Stripe supporte : cartes (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay et plus. L'auto-recharge est opt-in. Les clients Enterprise peuvent payer sur facture avec conditions Net 30.
Les nœuds edge tournent en Amérique du Nord, Europe et Asie-Pacifique. La logique de routage stateless tourne au bord pour une latence P50 sous 120 ms. Les données de facturation, comptes et logs d'audit sont stockés dans une région primaire avec réplication multi-régions.

Trois minutes jusqu'au premier appel.

Une seule API compatible OpenAI pour Claude, Gemini, GPT-Image et 200+ autres — recharge minimale de $5, vous ne payez que ce que vous appelez.

Commencer Lire le quickstart