Modelos Precios Documentación Guías Casos de uso Comparar Acerca de

Iniciar sesión Empezar

Novedad — Gemini 3, Claude Opus 4.7, Veo 3 ya disponibles

Modelos de frontera,
30–70 % menos que el precio oficial.

Los modelos de frontera de OpenAI, Anthropic y Google — Claude, Gemini, GPT-Image, Veo — todos con un 30–70 % de descuento sobre el precio oficial, tras una API compatible con OpenAI. Cambia una línea de base_url y estás en producción.

Empezar Leer la doc

Configuración en 5 segundos · Sin tarjeta · Sin mínimo

Pega esto en tu AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Proveedores integrados

OpenAIAnthropicGoogle

30–70 %

Bajo el precio oficial

3.200+

Desarrolladores activos

240 M+

Llamadas API al mes

99,95 %

SLA de disponibilidad

<120 ms

Latencia P50

200+

Modelos disponibles

Por qué Kunavo

El gateway de AI para devs que envían a producción.

Desde la capa de routing hasta el libro mayor de facturación, cada capa de Kunavo está diseñada para devs independientes y equipos pequeños que entregan funciones de AI a usuarios reales.

Edge gateway global

Routing Anycast multi-región con terminación TLS en el borde. P50 por debajo de 120 ms desde Norteamérica, UE o APAC.

Compatible con OpenAI

Reemplazo drop-in para el SDK de OpenAI. Streaming, function calling, tool use, vision — todo compatible a nivel de protocolo. Sin nuevo cliente que aprender.

Facturación nativa Stripe

Tarjetas, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — todos los métodos de Stripe. Recarga self-service, auto-recarga, facturación automática.

Modelos de frontera, 30–70 % más baratos

Cada modelo de OpenAI, Anthropic y Google al precio oficial menos 30–70 %. Claude, Gemini, GPT-Image, Veo — texto, imagen y video en una sola factura.

Precios transparentes

Tarifas por millón de tokens publicadas para cada modelo. Sin multiplicadores ocultos, sin sorpresas, las requests fallidas no se facturan.

99,95 % SLA

Failover multi-proveedor en menos de 50 ms. Cuando un upstream tambalea, tu request se re-rutea antes de que lo notes.

Streaming de primera clase

Implementación nativa SSE passthrough. Time-to-first-token idéntico al upstream — sin buffering, sin batching, sin latencia añadida.

Uso granular

Analytics call-by-call por modelo, por clave, por IP. Webhooks de eventos de uso. Exporta todo a CSV cuando quieras.

Prompt caching, hasta 90 % más barato

Las lecturas de caché de Anthropic se facturan al 10 % del precio de input — pasa cache_control en tu system prompt y los contextos largos se vuelven re-lecturas casi gratuitas. Hit rate y ahorro en tiempo real en el dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Catálogo de modelos

Modelos de frontera, 30–70 % bajo precio oficial.

Ver catálogo completo

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Para AI agents

Apunta tu agente a `llms.txt`
y se autoejecuta.

Dale a Claude Code, Cursor, Cline — o a cualquier agente compatible con OpenAI — una sola instrucción. Cargará el catálogo de modelos en vivo de Kunavo y operará modelos de texto, imagen y video de forma autónoma. Sin SDK, sin glue code.

Compatible con el protocolo OpenAI — los agentes no necesitan integración personalizada
GET /v1/models es el catálogo en vivo — nunca hagas hardcode de nombres de modelos
Una clave, todas las modalidades: texto, imagen, video, audio

Pega esto en tu AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Recarga y ahorra

Cuanto más recargas por adelantado, más ahorras.

Cartera prepago. Desde $10. Sin suscripciones, sin mínimos, el saldo no caduca.

Starter

Primeras pruebas

$10

Acceso a todos los modelos
Analytics call-by-call
Soporte comunidad y email
Sin mínimo, sin tarjeta

Regístrate gratis

Most popular

Builder

Limitado · +$10

Estás construyendo un producto

$100

$110 de crédito por $100 recargados
10 API keys independientes
Auto-recarga · Lista IP permitida
Soporte email prioritario

Scale

Limitado · +$250

Tráfico en producción

$1000

$1.250 de crédito por $1.000 recargados
API keys ilimitadas
Webhooks · Facturas mensuales
Soporte dedicado Slack/Discord

Enterprise

Limitado · +$2000

Gran escala

$5000

$7.000 de crédito por $5.000 recargados
Todo Scale + más
Rate limits y SLA personalizados
Account manager dedicado

Ver tabla de precios completa

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Todo lo que
te preguntas.

¿No encuentras respuesta? Escríbenos a contact@kunavo.com — respondemos en 24 horas.

Kunavo está diseñado específicamente para devs indies y equipos pequeños que envían features AI a producción. Tres diferencias reales: (1) cubrimos texto, imagen y video en una sola factura — muchos agregadores son solo texto; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay todo incluido — sin facturas fuera de plataforma; (3) transparencia total en routing — nunca cambiamos silenciosamente tu modelo por uno más barato.
Cada modelo está alrededor de un 30–70 % por debajo del precio oficial del proveedor — y las recargas grandes añaden un bono adicional. También ahorras en operaciones: un contrato, una factura, un SDK, sin compromisos mínimos. El precio por millón de tokens de cada modelo está publicado en /pricing — comparable con el listing upstream en cualquier momento.
Sí. Implementamos el conjunto completo de endpoints de OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models y /v1/video/generations. Streaming, function calling, vision y tool use se comportan idénticamente. Los proyectos que usan el SDK de OpenAI migran cambiando base_url — eso es todo.
No. Kunavo es una cartera prepago. Las recargas permanecen en tu cuenta para siempre — sin suscripciones, sin mínimos mensuales, sin caducidad. El cierre de cuenta reembolsa el saldo restante al método de pago original.
Nunca. Las respuestas 4xx y 5xx no se facturan. Las respuestas en streaming que se desconectan a mitad de camino solo se facturan por los tokens efectivamente entregados. Cada cargo es visible call-by-call en el dashboard de uso, exportable a CSV para contabilidad.
Todo lo que soporta Stripe: tarjetas (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay y más. La auto-recarga es opt-in. Los clientes Enterprise pueden pagar por factura con condiciones Net 30.
Los nodos edge están desplegados en Norteamérica, Europa y Asia-Pacífico. La lógica de routing stateless corre en el borde para latencia P50 por debajo de 120 ms. Los datos de facturación, cuentas y logs de auditoría se almacenan en una región primaria con replicación multi-región.

Tres minutos hasta tu primera llamada.

Una sola API compatible con OpenAI para Claude, Gemini, GPT-Image y 200+ modelos más — recarga mínima de $5, pagas solo por lo que llamas.

Empezar Leer el quickstart