Modelos de fronteira,
30 % abaixo do preço oficial.
Os modelos de fronteira da OpenAI, Anthropic e Google — Claude, Gemini, GPT-Image, Veo — todos com 30 % de desconto sobre o preço oficial, atrás de uma única API compatível com OpenAI. Mude uma linha de base_url e está em produção.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Provedores integrados
O gateway de AI para devs que entregam.
Da camada de routing ao livro contábil de billing, cada camada do Kunavo é desenhada para devs indies e times pequenos que entregam features de AI a usuários reais.
Gateway edge global
Routing Anycast multirregião com terminação TLS na borda. P50 abaixo de 120 ms da América do Norte, UE ou APAC.
Compatível com OpenAI
Substituto drop-in para o SDK da OpenAI. Streaming, function calling, tool use, vision — tudo compatível no nível do protocolo. Sem cliente novo para aprender.
Billing nativo Stripe
Cartões, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — todos os métodos do Stripe. Recarga self-service, auto-recharge, faturamento automático.
Modelos de fronteira, 30 % mais barato
Cada modelo da OpenAI, Anthropic e Google ao preço de tabela oficial menos 30 %. Claude, Gemini, GPT-Image, Veo — texto, imagem, vídeo em uma só fatura.
Preço transparente
Preço por 1 M de tokens publicado para cada modelo. Sem multiplicadores ocultos, sem surpresas, requests que falham não são cobradas.
99,95 % SLA
Failover multi-provedor em menos de 50 ms. Quando um upstream cambaleia, sua request é redirecionada antes de você perceber.
Streaming de primeira classe
Implementação nativa SSE passthrough. Time-to-first-token igual ao upstream — sem buffering, sem batching, sem latência adicionada.
Uso granular
Analytics call-by-call por modelo, chave, IP. Webhooks de eventos de uso. Exporte tudo em CSV quando quiser.
Prompt caching, até 90 % mais barato
Leituras de cache da Anthropic são cobradas a 10 % da taxa de input — passe cache_control no seu system prompt e contextos longos viram re-leituras quase grátis. Hit rate e economia em tempo real no dashboard.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
Modelos de fronteira, 30 % abaixo do oficial.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
Aponte seu agente para llms.txt
e ele se vira sozinho.
Dê ao Claude Code, Cursor, Cline — ou qualquer agente compatível com OpenAI — uma única instrução. Ele carregará o catálogo ao vivo do Kunavo e operará modelos de texto, imagem e vídeo autonomamente. Sem SDK, sem glue code.
- Compatível com o protocolo OpenAI — agentes não precisam de integração custom
- GET /v1/models é o catálogo ao vivo — nunca hardcode nomes de modelo
- Uma chave, todas as modalidades: texto, imagem, vídeo, áudio
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Quanto mais você recarrega adiantado, mais economiza.
Carteira pré-paga. A partir de $10. Sem assinatura, sem mínimo, saldo nunca expira.
Starter
Primeiros testes
- Acesso a todos os modelos
- Analytics call-by-call
- Suporte por comunidade e e-mail
- Sem mínimo, sem cartão
Builder
Limitado · +$10Você está construindo um produto
- $110 de crédito ao recarregar $100
- 10 chaves de API separadas
- Auto-recharge · Allowlist de IP
- Suporte por e-mail prioritário
Scale
Limitado · +$250Tráfego em produção
- $1.250 de crédito ao recarregar $1.000
- Chaves de API ilimitadas
- Webhooks · Faturas mensais
- Suporte dedicado Slack/Discord
Enterprise
Limitado · +$2000Grande escala
- $7.000 de crédito ao recarregar $5.000
- Tudo do Scale + mais
- Rate limits e SLA customizados
- Account manager dedicado
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Tudo que você
se pergunta.
Não encontrou resposta? Escreva para contact@kunavo.com — respondemos em 24 horas.
O Kunavo foi feito especificamente para devs indies e times pequenos que entregam features de AI em produção. Três diferenças reais: (1) cobrimos texto, imagem e vídeo em uma única fatura — muitos agregadores são só texto; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay tudo incluso — sem faturas fora da plataforma; (3) transparência total no routing — nunca trocamos silenciosamente seu modelo por um mais barato.
Cada modelo está cerca de 30 % abaixo do preço oficial do provedor — e recargas maiores liberam bônus adicional. Você também economiza operacionalmente: um contrato, uma fatura, um SDK, $2 de crédito inicial, sem mínimo de compromisso. O preço por 1 M de tokens de cada modelo está publicado em /pricing — comparável com o listing upstream a qualquer momento.
Sim. Implementamos o conjunto completo de endpoints da OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models e /v1/video/generations. Streaming, function calling, vision e tool use se comportam identicamente. Projetos que usam o SDK da OpenAI migram trocando base_url — é só isso.
Não. O Kunavo é uma carteira pré-paga. Recargas permanecem na sua conta para sempre — sem assinatura, sem mínimo mensal, sem expiração. Fechamento de conta reembolsa o saldo restante no método de pagamento original.
Nunca. Respostas 4xx e 5xx não são cobradas. Respostas em streaming que desconectam no meio são cobradas apenas pelos tokens efetivamente entregues. Cada cobrança é visível call-by-call no dashboard de uso e exportável em CSV para contabilidade.
Tudo que o Stripe suporta: cartões (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay e mais. Auto-recharge é opt-in. Clientes Enterprise podem pagar por fatura com prazos Net 30.
Nós edge gateway rodam em América do Norte, Europa e Ásia-Pacífico. Lógica de routing stateless roda na borda, com latência P50 abaixo de 120 ms. Dados de billing, contas e logs de auditoria ficam em uma região primária com replicação multi-região.
Três minutos até sua primeira chamada.
O cadastro dá $2 de crédito — suficiente para colocar Claude, Gemini e GPT-Image para suar. Sem cartão.