Modelle Preise Dokumentation Leitfäden Anwendungsfälle Vergleich Über uns

Anmelden Loslegen

Neu — Gemini 3, Claude Opus 4.7, Veo 3 sind live

Frontier-Modelle,
30–70 % unter offiziellem Preis.

Frontier-Modelle von OpenAI, Anthropic und Google — Claude, Gemini, GPT-Image, Veo — alle 30–70 % unter dem offiziellen Preis, hinter einer OpenAI-kompatiblen API. Eine Zeile base_url ändern und in Produktion gehen.

Jetzt starten Doku lesen

Setup in 5 Sekunden · Keine Karte nötig · Kein Mindestumsatz

An deinen AI-Agenten weitergeben

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Integrierte Anbieter

OpenAIAnthropicGoogle

30–70 %

Unter offiziellem Preis

3.200+

Aktive Entwickler

240 Mio.+

API-Aufrufe pro Monat

99,95 %

Uptime-SLA

<120 ms

P50-Latenz

200+

Modelle live

Warum Kunavo

Das AI-Gateway für Entwickler, die ausliefern.

Von der Routing-Schicht bis zum Abrechnungsbuch ist jede Ebene von Kunavo für Indie-Entwickler und kleine Teams entworfen, die AI-Features an echte Nutzer ausliefern.

Globales Edge-Gateway

Multi-Region-Anycast-Routing mit TLS-Terminierung am Edge. P50 unter 120 ms aus Nordamerika, der EU oder dem APAC-Raum.

OpenAI-kompatibel

Drop-in-Ersatz für das OpenAI SDK. Streaming, Function Calling, Tool Use, Vision — alles wire-kompatibel. Kein neuer Client zu lernen.

Stripe-native Abrechnung

Karten, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — alle Stripe-Methoden. Self-Service-Aufladung, Auto-Recharge, automatische Rechnungen.

Frontier-Modelle, 30–70 % günstiger

Jedes Modell von OpenAI, Anthropic und Google zum offiziellen Listenpreis minus 30–70 %. Claude, Gemini, GPT-Image, Veo — Text, Bild, Video auf einer Rechnung.

Transparente Preise

Pro-1-M-Token-Preise für jedes Modell sind veröffentlicht. Keine versteckten Multiplikatoren, keine Überraschungen, keine Abrechnung fehlgeschlagener Anfragen.

99,95 % SLA

Multi-Provider-Failover in unter 50 ms. Wenn ein Upstream wackelt, wird deine Anfrage umgeleitet, bevor du es merkst.

Erstklassiges Streaming

Native SSE-Passthrough-Implementierung. Time-to-first-token ist identisch mit dem Upstream — kein Puffern, kein Batching, keine Latenz.

Granulare Nutzungsdaten

Call-by-Call-Analytics nach Modell, Key und IP. Usage-Events per Webhook. CSV-Export jederzeit verfügbar.

Prompt-Caching, bis zu 90 % günstiger

Anthropic-Cache-Reads werden mit 10 % des Input-Tarifs abgerechnet — ein cache_control in deinem System-Prompt verwandelt lange Kontexte in nahezu kostenlose Re-Reads. Hit-Rate und Ersparnis live im Dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Modellkatalog

Frontier-Modelle, 30–70 % unter offiziellem Preis.

Vollständigen Katalog ansehen

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Für AI Agents

Richte deinen Agenten `llms.txt`
— läuft autonom.

Gib Claude Code, Cursor, Cline — oder jedem OpenAI-kompatiblen Agenten — eine einzige Anweisung. Er lädt den Live-Modellkatalog von Kunavo und steuert Text-, Bild- und Video-Modelle autonom. Kein SDK, kein Glue-Code nötig.

OpenAI-wire-kompatibel — Agenten brauchen keine Custom-Integration
GET /v1/models ist der Live-Katalog — niemals Modellnamen hardcoden
Ein Key, alle Modalitäten: Text, Bild, Video, Audio

An deinen AI-Agenten weitergeben

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Aufladen und sparen

Je mehr du im Voraus auflädst, desto mehr sparst du.

Prepaid-Wallet. Ab $10. Keine Abos, kein Mindestumsatz, Guthaben verfällt nie.

Starter

Erste Tests

$10

Zugang zu allen Modellen
Call-by-Call-Analytics
Community- & E-Mail-Support
Keine Mindestabnahme, keine Karte nötig

Kostenlos registrieren

Most popular

Builder

Limitiert · +$10

Du baust ein Produkt

$100

$110 Guthaben bei $100 Top-Up
10 separate API-Keys
Auto-Recharge · IP-Allowlist
Priorisierter E-Mail-Support

Scale

Limitiert · +$250

Produktiver Traffic

$1000

$1.250 Guthaben bei $1.000 Top-Up
Unbegrenzte API-Keys
Webhooks · Monatliche Rechnungen
Dedizierter Slack/Discord-Support

Enterprise

Limitiert · +$2000

Großer Maßstab

$5000

$7.000 Guthaben bei $5.000 Top-Up
Alles aus Scale + mehr
Custom Rate Limits & SLA
Persönlicher Account Manager

Vollständige Preistabelle ansehen

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Alles, was du dich
fragst.

Keine Antwort auf deine Frage? Schreib an contact@kunavo.com — wir antworten innerhalb von 24 Stunden.

Kunavo ist speziell für Indie-Entwickler und kleine Teams gebaut, die produktive AI-Features ausliefern. Drei echte Unterschiede: (1) Wir decken Text, Bild und Video auf einer Rechnung ab — viele Aggregatoren bieten nur Text; (2) Stripe-native Checkouts, ACH, SEPA, Apple Pay, WeChat Pay alles dabei — keine Off-Plattform-Rechnungen; (3) Volle Routing-Transparenz — wir tauschen dein Modell niemals heimlich gegen ein günstigeres aus.
Jedes Modell ist rund 30–70 % unter dem offiziellen Listenpreis des Anbieters — größere Top-Ups bringen einen zusätzlichen Bonus. Operativ sparst du außerdem: ein Vertrag, eine Rechnung, ein SDK, keine Mindestabnahme. Der Pro-1-M-Token-Preis jedes Modells steht auf /pricing — jederzeit mit dem Upstream-Listenpreis vergleichbar.
Ja. Wir implementieren das komplette OpenAI-Endpoint-Set: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models und /v1/video/generations. Streaming, Function Calling, Vision und Tool Use verhalten sich identisch. Projekte, die das OpenAI SDK nutzen, migrieren durch Ändern der base_url — das war's.
Nein. Kunavo ist ein Prepaid-Wallet. Top-Ups bleiben für immer auf deinem Konto — keine Abos, keine Mindestumsätze pro Monat, kein Verfall. Bei Konto-Schließung erstatten wir Restguthaben auf das ursprüngliche Zahlungsmittel.
Niemals. 4xx- und 5xx-Antworten werden nicht abgerechnet. Streaming-Antworten, die mittendrin abbrechen, werden nur für die tatsächlich gelieferten Tokens belastet. Jede Belastung ist call-by-call im Usage-Dashboard sichtbar und als CSV exportierbar.
Alles, was Stripe unterstützt: Karten (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay und mehr. Auto-Recharge ist opt-in. Enterprise-Kunden können auf Rechnung mit Net-30-Konditionen zahlen.
Edge-Gateway-Nodes laufen in Nordamerika, Europa und Asien-Pazifik. Stateless-Routing-Logik läuft am Edge mit P50-Latenz unter 120 ms. Abrechnungsdaten, Accounts und Audit-Logs liegen in einer Primärregion mit Multi-Region-Replikation.

Drei Minuten bis zum ersten Aufruf.

Eine OpenAI-kompatible API für Claude, Gemini, GPT-Image und 200+ weitere — $5 Mindestaufladung, du zahlst nur für das, was du aufrufst.

Jetzt starten Quickstart lesen