Modèles frontière,
30 % sous le tarif officiel.
Les modèles frontière d'OpenAI, Anthropic et Google — Claude, Gemini, GPT-Image, Veo — tous 30 % sous le tarif officiel, derrière une seule API compatible OpenAI. Changez une ligne base_url et vous êtes en production.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Fournisseurs intégrés
La passerelle AI pour les devs qui livrent.
De la couche de routage au registre de facturation, chaque couche de Kunavo est conçue pour les développeurs indépendants et les petites équipes qui livrent de l'AI à de vrais utilisateurs.
Passerelle edge globale
Routage Anycast multi-régions avec terminaison TLS au bord. Latence P50 sous 120 ms depuis l'Amérique du Nord, l'UE ou l'APAC.
Compatible OpenAI
Remplacement drop-in du SDK OpenAI. Streaming, function calling, tool use, vision — tout est compatible au niveau du protocole. Aucun nouveau client à apprendre.
Facturation native Stripe
Cartes, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — toutes les méthodes Stripe. Recharge en self-service, auto-recharge, facturation automatique.
Modèles frontière, 30 % moins cher
Chaque modèle d'OpenAI, Anthropic et Google au tarif officiel listé moins 30 %. Claude, Gemini, GPT-Image, Veo — texte, image, vidéo sur une seule facture.
Tarification transparente
Tarif par million de tokens publié pour chaque modèle. Pas de multiplicateurs cachés, pas de surprises, pas de facturation des requêtes échouées.
SLA 99,95 %
Bascule automatique entre fournisseurs en moins de 50 ms. Quand un upstream vacille, votre requête est reroutée avant que vous ne le remarquiez.
Streaming de classe mondiale
Implémentation native SSE passthrough. Time-to-first-token identique à l'upstream — pas de buffering, pas de batching, pas de latence.
Utilisation détaillée
Analytics call-by-call par modèle, par clé, par IP. Webhooks d'événements d'utilisation. Export CSV de tout, à tout moment.
Prompt caching, jusqu'à 90 % moins cher
Les lectures de cache Anthropic sont facturées à 10 % du tarif d'input — passez cache_control dans votre system prompt et les longs contextes deviennent des re-lectures quasi gratuites. Hit rate et économies visibles en direct dans le dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Modèles frontière, 30 % sous le tarif officiel.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
Pointez votre agent vers llms.txt
et il roule seul.
Donnez à Claude Code, Cursor, Cline — ou tout agent compatible OpenAI — une seule instruction. Il chargera le catalogue de modèles live de Kunavo et pilotera de manière autonome texte, image et vidéo. Pas besoin de SDK ni de glue code.
- Compatible avec le protocole OpenAI — aucune intégration custom requise
- GET /v1/models est le catalogue live — ne jamais hardcoder les noms de modèles
- Une clé, toutes les modalités : texte, image, vidéo, audio
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Plus vous rechargez à l'avance, plus vous économisez.
Portefeuille prépayé. À partir de $10. Pas d'abonnement, pas de minimum, le solde n'expire jamais.
Starter
Premiers tests
- Accès à tous les modèles
- Analytics call-by-call
- Support communautaire & e-mail
- Sans minimum, sans carte
Builder
Limité · +$10Vous construisez un produit
- $110 de crédit pour $100 rechargés
- 10 clés API distinctes
- Auto-recharge · Whitelist IP
- Support e-mail prioritaire
Scale
Limité · +$250Trafic en production
- $1 250 de crédit pour $1 000 rechargés
- Clés API illimitées
- Webhooks · Factures mensuelles
- Support Slack/Discord dédié
Enterprise
Limité · +$2000Grande échelle
- $7 000 de crédit pour $5 000 rechargés
- Tout Scale + plus
- Rate limits & SLA personnalisés
- Account manager dédié
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Tout ce que vous
vous demandez.
Pas de réponse à votre question ? Écrivez à contact@kunavo.com — nous répondons sous 24 heures.
Kunavo est conçu pour les développeurs indépendants et les petites équipes qui expédient des fonctionnalités AI en production. Trois vraies différences : (1) nous couvrons texte, image et vidéo sur une seule facture — beaucoup d'agrégateurs ne font que du texte ; (2) checkout natif Stripe, ACH, SEPA, Apple Pay, WeChat Pay tout inclus — aucune facture hors plateforme ; (3) transparence totale du routage — nous ne remplaçons jamais silencieusement votre modèle par un moins cher.
Chaque modèle est tarifé environ 30 % sous le prix catalogue officiel du fournisseur — et les recharges importantes débloquent un bonus supplémentaire. Vous économisez aussi en opérations : un contrat, une facture, un SDK, $2 de crédit de démarrage, pas de minimum d'engagement. Le tarif par million de tokens de chaque modèle est publié sur /pricing — comparable à tout moment au listing upstream.
Oui. Nous implémentons l'ensemble complet des endpoints OpenAI : /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models et /v1/video/generations. Streaming, function calling, vision et tool use se comportent à l'identique. Les projets utilisant le SDK OpenAI migrent en changeant base_url — c'est tout.
Non. Kunavo est un portefeuille prépayé. Les recharges restent sur votre compte pour toujours — pas d'abonnement, pas de minimum mensuel, pas d'expiration. La fermeture de compte rembourse le solde restant sur le moyen de paiement d'origine.
Jamais. Les réponses 4xx et 5xx ne sont pas facturées. Les réponses streamées qui se déconnectent en cours de route ne sont facturées que sur les tokens effectivement livrés. Chaque charge est visible call-by-call dans le dashboard d'utilisation, exportable en CSV pour la comptabilité.
Tout ce que Stripe supporte : cartes (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay et plus. L'auto-recharge est opt-in. Les clients Enterprise peuvent payer sur facture avec conditions Net 30.
Les nœuds edge tournent en Amérique du Nord, Europe et Asie-Pacifique. La logique de routage stateless tourne au bord pour une latence P50 sous 120 ms. Les données de facturation, comptes et logs d'audit sont stockés dans une région primaire avec réplication multi-régions.
Trois minutes jusqu'au premier appel.
L'inscription vous donne $2 de crédit — assez pour mettre Claude, Gemini et GPT-Image à l'épreuve. Pas de carte requise.