Neu — Gemini 3, Claude Opus 4.7, Veo 3 sind live

Frontier-Modelle,
30 % unter offiziellem Preis.

Frontier-Modelle von OpenAI, Anthropic und Google — Claude, Gemini, GPT-Image, Veo — alle 30 % unter dem offiziellen Preis, hinter einer OpenAI-kompatiblen API. Eine Zeile base_url ändern und in Produktion gehen.

Setup in 5 Sekunden · Keine Karte nötig · Kein Mindestumsatz
An deinen AI-Agenten weitergeben
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Integrierte Anbieter

OpenAIAnthropicGoogle
30 %
Unter offiziellem Preis
3.200+
Aktive Entwickler
240 Mio.+
API-Aufrufe pro Monat
99,95 %
Uptime-SLA
<120 ms
P50-Latenz
$2
Kostenloses Guthaben
Warum Kunavo

Das AI-Gateway für Entwickler, die ausliefern.

Von der Routing-Schicht bis zum Abrechnungsbuch ist jede Ebene von Kunavo für Indie-Entwickler und kleine Teams entworfen, die AI-Features an echte Nutzer ausliefern.

Globales Edge-Gateway

Multi-Region-Anycast-Routing mit TLS-Terminierung am Edge. P50 unter 120 ms aus Nordamerika, der EU oder dem APAC-Raum.

OpenAI-kompatibel

Drop-in-Ersatz für das OpenAI SDK. Streaming, Function Calling, Tool Use, Vision — alles wire-kompatibel. Kein neuer Client zu lernen.

Stripe-native Abrechnung

Karten, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — alle Stripe-Methoden. Self-Service-Aufladung, Auto-Recharge, automatische Rechnungen.

Frontier-Modelle, 30 % günstiger

Jedes Modell von OpenAI, Anthropic und Google zum offiziellen Listenpreis minus 30 %. Claude, Gemini, GPT-Image, Veo — Text, Bild, Video auf einer Rechnung.

Transparente Preise

Pro-1-M-Token-Preise für jedes Modell sind veröffentlicht. Keine versteckten Multiplikatoren, keine Überraschungen, keine Abrechnung fehlgeschlagener Anfragen.

99,95 % SLA

Multi-Provider-Failover in unter 50 ms. Wenn ein Upstream wackelt, wird deine Anfrage umgeleitet, bevor du es merkst.

Erstklassiges Streaming

Native SSE-Passthrough-Implementierung. Time-to-first-token ist identisch mit dem Upstream — kein Puffern, kein Batching, keine Latenz.

Granulare Nutzungsdaten

Call-by-Call-Analytics nach Modell, Key und IP. Usage-Events per Webhook. CSV-Export jederzeit verfügbar.

Prompt-Caching, bis zu 90 % günstiger

Anthropic-Cache-Reads werden mit 10 % des Input-Tarifs abgerechnet — ein cache_control in deinem System-Prompt verwandelt lange Kontexte in nahezu kostenlose Re-Reads. Hit-Rate und Ersparnis live im Dashboard.

Modellkatalog

Frontier-Modelle, 30 % unter offiziellem Preis.

Vollständigen Katalog ansehen
Für AI Agents

Richte deinen Agenten llms.txt
— läuft autonom.

Gib Claude Code, Cursor, Cline — oder jedem OpenAI-kompatiblen Agenten — eine einzige Anweisung. Er lädt den Live-Modellkatalog von Kunavo und steuert Text-, Bild- und Video-Modelle autonom. Kein SDK, kein Glue-Code nötig.

  • OpenAI-wire-kompatibel — Agenten brauchen keine Custom-Integration
  • GET /v1/models ist der Live-Katalog — niemals Modellnamen hardcoden
  • Ein Key, alle Modalitäten: Text, Bild, Video, Audio
An deinen AI-Agenten weitergeben
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Aufladen und sparen

Je mehr du im Voraus auflädst, desto mehr sparst du.

Prepaid-Wallet. Ab $10. Keine Abos, kein Mindestumsatz, Guthaben verfällt nie.

Starter

Erste Tests

$10
  • Zugang zu allen Modellen
  • Call-by-Call-Analytics
  • Community- & E-Mail-Support
  • Keine Mindestabnahme, keine Karte nötig
Kostenlos registrieren
Most popular

Builder

Limitiert · +$10

Du baust ein Produkt

$100
  • $110 Guthaben bei $100 Top-Up
  • 10 separate API-Keys
  • Auto-Recharge · IP-Allowlist
  • Priorisierter E-Mail-Support
$100 aufladen

Scale

Limitiert · +$250

Produktiver Traffic

$1000
  • $1.250 Guthaben bei $1.000 Top-Up
  • Unbegrenzte API-Keys
  • Webhooks · Monatliche Rechnungen
  • Dedizierter Slack/Discord-Support
$1000 aufladen

Enterprise

Limitiert · +$2000

Großer Maßstab

$5000
  • $7.000 Guthaben bei $5.000 Top-Up
  • Alles aus Scale + mehr
  • Custom Rate Limits & SLA
  • Persönlicher Account Manager
$5000 aufladen
FAQ

Alles, was du dich
fragst.

Keine Antwort auf deine Frage? Schreib an contact@kunavo.com — wir antworten innerhalb von 24 Stunden.

  • Kunavo ist speziell für Indie-Entwickler und kleine Teams gebaut, die produktive AI-Features ausliefern. Drei echte Unterschiede: (1) Wir decken Text, Bild und Video auf einer Rechnung ab — viele Aggregatoren bieten nur Text; (2) Stripe-native Checkouts, ACH, SEPA, Apple Pay, WeChat Pay alles dabei — keine Off-Plattform-Rechnungen; (3) Volle Routing-Transparenz — wir tauschen dein Modell niemals heimlich gegen ein günstigeres aus.

  • Jedes Modell ist rund 30 % unter dem offiziellen Listenpreis des Anbieters — größere Top-Ups bringen einen zusätzlichen Bonus. Operativ sparst du außerdem: ein Vertrag, eine Rechnung, ein SDK, $2 Starter-Guthaben, keine Mindestabnahme. Der Pro-1-M-Token-Preis jedes Modells steht auf /pricing — jederzeit mit dem Upstream-Listenpreis vergleichbar.

  • Ja. Wir implementieren das komplette OpenAI-Endpoint-Set: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models und /v1/video/generations. Streaming, Function Calling, Vision und Tool Use verhalten sich identisch. Projekte, die das OpenAI SDK nutzen, migrieren durch Ändern der base_url — das war's.

  • Nein. Kunavo ist ein Prepaid-Wallet. Top-Ups bleiben für immer auf deinem Konto — keine Abos, keine Mindestumsätze pro Monat, kein Verfall. Bei Konto-Schließung erstatten wir Restguthaben auf das ursprüngliche Zahlungsmittel.

  • Niemals. 4xx- und 5xx-Antworten werden nicht abgerechnet. Streaming-Antworten, die mittendrin abbrechen, werden nur für die tatsächlich gelieferten Tokens belastet. Jede Belastung ist call-by-call im Usage-Dashboard sichtbar und als CSV exportierbar.

  • Alles, was Stripe unterstützt: Karten (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay und mehr. Auto-Recharge ist opt-in. Enterprise-Kunden können auf Rechnung mit Net-30-Konditionen zahlen.

  • Edge-Gateway-Nodes laufen in Nordamerika, Europa und Asien-Pazifik. Stateless-Routing-Logik läuft am Edge mit P50-Latenz unter 120 ms. Abrechnungsdaten, Accounts und Audit-Logs liegen in einer Primärregion mit Multi-Region-Replikation.

Drei Minuten bis zum ersten Aufruf.

Mit der Registrierung bekommst du $2 Guthaben — genug, um Claude, Gemini und GPT-Image gründlich zu testen. Keine Karte nötig.