Modelos de frontera,
30 % menos que el precio oficial.
Los modelos de frontera de OpenAI, Anthropic y Google — Claude, Gemini, GPT-Image, Veo — todos con un 30 % de descuento sobre el precio oficial, tras una API compatible con OpenAI. Cambia una línea de base_url y estás en producción.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Proveedores integrados
El gateway de AI para devs que envían a producción.
Desde la capa de routing hasta el libro mayor de facturación, cada capa de Kunavo está diseñada para devs independientes y equipos pequeños que entregan funciones de AI a usuarios reales.
Edge gateway global
Routing Anycast multi-región con terminación TLS en el borde. P50 por debajo de 120 ms desde Norteamérica, UE o APAC.
Compatible con OpenAI
Reemplazo drop-in para el SDK de OpenAI. Streaming, function calling, tool use, vision — todo compatible a nivel de protocolo. Sin nuevo cliente que aprender.
Facturación nativa Stripe
Tarjetas, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — todos los métodos de Stripe. Recarga self-service, auto-recarga, facturación automática.
Modelos de frontera, 30 % más baratos
Cada modelo de OpenAI, Anthropic y Google al precio oficial menos 30 %. Claude, Gemini, GPT-Image, Veo — texto, imagen y video en una sola factura.
Precios transparentes
Tarifas por millón de tokens publicadas para cada modelo. Sin multiplicadores ocultos, sin sorpresas, las requests fallidas no se facturan.
99,95 % SLA
Failover multi-proveedor en menos de 50 ms. Cuando un upstream tambalea, tu request se re-rutea antes de que lo notes.
Streaming de primera clase
Implementación nativa SSE passthrough. Time-to-first-token idéntico al upstream — sin buffering, sin batching, sin latencia añadida.
Uso granular
Analytics call-by-call por modelo, por clave, por IP. Webhooks de eventos de uso. Exporta todo a CSV cuando quieras.
Prompt caching, hasta 90 % más barato
Las lecturas de caché de Anthropic se facturan al 10 % del precio de input — pasa cache_control en tu system prompt y los contextos largos se vuelven re-lecturas casi gratuitas. Hit rate y ahorro en tiempo real en el dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Modelos de frontera, 30 % bajo precio oficial.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
Apunta tu agente a llms.txt
y se autoejecuta.
Dale a Claude Code, Cursor, Cline — o a cualquier agente compatible con OpenAI — una sola instrucción. Cargará el catálogo de modelos en vivo de Kunavo y operará modelos de texto, imagen y video de forma autónoma. Sin SDK, sin glue code.
- Compatible con el protocolo OpenAI — los agentes no necesitan integración personalizada
- GET /v1/models es el catálogo en vivo — nunca hagas hardcode de nombres de modelos
- Una clave, todas las modalidades: texto, imagen, video, audio
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Cuanto más recargas por adelantado, más ahorras.
Cartera prepago. Desde $10. Sin suscripciones, sin mínimos, el saldo no caduca.
Starter
Primeras pruebas
- Acceso a todos los modelos
- Analytics call-by-call
- Soporte comunidad y email
- Sin mínimo, sin tarjeta
Builder
Limitado · +$10Estás construyendo un producto
- $110 de crédito por $100 recargados
- 10 API keys independientes
- Auto-recarga · Lista IP permitida
- Soporte email prioritario
Scale
Limitado · +$250Tráfico en producción
- $1.250 de crédito por $1.000 recargados
- API keys ilimitadas
- Webhooks · Facturas mensuales
- Soporte dedicado Slack/Discord
Enterprise
Limitado · +$2000Gran escala
- $7.000 de crédito por $5.000 recargados
- Todo Scale + más
- Rate limits y SLA personalizados
- Account manager dedicado
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Todo lo que
te preguntas.
¿No encuentras respuesta? Escríbenos a contact@kunavo.com — respondemos en 24 horas.
Kunavo está diseñado específicamente para devs indies y equipos pequeños que envían features AI a producción. Tres diferencias reales: (1) cubrimos texto, imagen y video en una sola factura — muchos agregadores son solo texto; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay todo incluido — sin facturas fuera de plataforma; (3) transparencia total en routing — nunca cambiamos silenciosamente tu modelo por uno más barato.
Cada modelo está alrededor de un 30 % por debajo del precio oficial del proveedor — y las recargas grandes añaden un bono adicional. También ahorras en operaciones: un contrato, una factura, un SDK, $2 de crédito inicial, sin compromisos mínimos. El precio por millón de tokens de cada modelo está publicado en /pricing — comparable con el listing upstream en cualquier momento.
Sí. Implementamos el conjunto completo de endpoints de OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models y /v1/video/generations. Streaming, function calling, vision y tool use se comportan idénticamente. Los proyectos que usan el SDK de OpenAI migran cambiando base_url — eso es todo.
No. Kunavo es una cartera prepago. Las recargas permanecen en tu cuenta para siempre — sin suscripciones, sin mínimos mensuales, sin caducidad. El cierre de cuenta reembolsa el saldo restante al método de pago original.
Nunca. Las respuestas 4xx y 5xx no se facturan. Las respuestas en streaming que se desconectan a mitad de camino solo se facturan por los tokens efectivamente entregados. Cada cargo es visible call-by-call en el dashboard de uso, exportable a CSV para contabilidad.
Todo lo que soporta Stripe: tarjetas (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay y más. La auto-recarga es opt-in. Los clientes Enterprise pueden pagar por factura con condiciones Net 30.
Los nodos edge están desplegados en Norteamérica, Europa y Asia-Pacífico. La lógica de routing stateless corre en el borde para latencia P50 por debajo de 120 ms. Los datos de facturación, cuentas y logs de auditoría se almacenan en una región primaria con replicación multi-región.
Tres minutos hasta tu primera llamada.
Registrarte te da $2 de crédito — suficiente para poner a prueba Claude, Gemini y GPT-Image. Sin tarjeta.