Modelos Preços Documentação Guias Casos de uso Comparar Sobre

Entrar Começar

Novo — Gemini 3, Claude Opus 4.7, Veo 3 já no ar

Modelos de fronteira,
30–70 % abaixo do preço oficial.

Os modelos de fronteira da OpenAI, Anthropic e Google — Claude, Gemini, GPT-Image, Veo — todos com 30–70 % de desconto sobre o preço oficial, atrás de uma única API compatível com OpenAI. Mude uma linha de base_url e está em produção.

Começar Ler a doc

Setup em 5 segundos · Sem cartão · Sem mínimo

Cole no seu AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Provedores integrados

OpenAIAnthropicGoogle

30–70 %

Abaixo do preço oficial

3.200+

Devs ativos

240 M+

Chamadas de API/mês

99,95 %

SLA de uptime

<120 ms

Latência P50

200+

Modelos disponíveis

Por que Kunavo

O gateway de AI para devs que entregam.

Da camada de routing ao livro contábil de billing, cada camada do Kunavo é desenhada para devs indies e times pequenos que entregam features de AI a usuários reais.

Gateway edge global

Routing Anycast multirregião com terminação TLS na borda. P50 abaixo de 120 ms da América do Norte, UE ou APAC.

Compatível com OpenAI

Substituto drop-in para o SDK da OpenAI. Streaming, function calling, tool use, vision — tudo compatível no nível do protocolo. Sem cliente novo para aprender.

Billing nativo Stripe

Cartões, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — todos os métodos do Stripe. Recarga self-service, auto-recharge, faturamento automático.

Modelos de fronteira, 30–70 % mais barato

Cada modelo da OpenAI, Anthropic e Google ao preço de tabela oficial menos 30–70 %. Claude, Gemini, GPT-Image, Veo — texto, imagem, vídeo em uma só fatura.

Preço transparente

Preço por 1 M de tokens publicado para cada modelo. Sem multiplicadores ocultos, sem surpresas, requests que falham não são cobradas.

99,95 % SLA

Failover multi-provedor em menos de 50 ms. Quando um upstream cambaleia, sua request é redirecionada antes de você perceber.

Streaming de primeira classe

Implementação nativa SSE passthrough. Time-to-first-token igual ao upstream — sem buffering, sem batching, sem latência adicionada.

Uso granular

Analytics call-by-call por modelo, chave, IP. Webhooks de eventos de uso. Exporte tudo em CSV quando quiser.

Prompt caching, até 90 % mais barato

Leituras de cache da Anthropic são cobradas a 10 % da taxa de input — passe cache_control no seu system prompt e contextos longos viram re-leituras quase grátis. Hit rate e economia em tempo real no dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Catálogo de modelos

Modelos de fronteira, 30–70 % abaixo do oficial.

Ver catálogo completo

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Para AI agents

Aponte seu agente para `llms.txt`
e ele se vira sozinho.

Dê ao Claude Code, Cursor, Cline — ou qualquer agente compatível com OpenAI — uma única instrução. Ele carregará o catálogo ao vivo do Kunavo e operará modelos de texto, imagem e vídeo autonomamente. Sem SDK, sem glue code.

Compatível com o protocolo OpenAI — agentes não precisam de integração custom
GET /v1/models é o catálogo ao vivo — nunca hardcode nomes de modelo
Uma chave, todas as modalidades: texto, imagem, vídeo, áudio

Cole no seu AI agent

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Recarregue e economize

Quanto mais você recarrega adiantado, mais economiza.

Carteira pré-paga. A partir de $10. Sem assinatura, sem mínimo, saldo nunca expira.

Starter

Primeiros testes

$10

Acesso a todos os modelos
Analytics call-by-call
Suporte por comunidade e e-mail
Sem mínimo, sem cartão

Cadastro grátis

Most popular

Builder

Limitado · +$10

Você está construindo um produto

$100

$110 de crédito ao recarregar $100
10 chaves de API separadas
Auto-recharge · Allowlist de IP
Suporte por e-mail prioritário

Recarregar $100

Scale

Limitado · +$250

Tráfego em produção

$1000

$1.250 de crédito ao recarregar $1.000
Chaves de API ilimitadas
Webhooks · Faturas mensais
Suporte dedicado Slack/Discord

Recarregar $1000

Enterprise

Limitado · +$2000

Grande escala

$5000

$7.000 de crédito ao recarregar $5.000
Tudo do Scale + mais
Rate limits e SLA customizados
Account manager dedicado

Recarregar $5000

Ver tabela de preços completa

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Tudo que você
se pergunta.

Não encontrou resposta? Escreva para contact@kunavo.com — respondemos em 24 horas.

O Kunavo foi feito especificamente para devs indies e times pequenos que entregam features de AI em produção. Três diferenças reais: (1) cobrimos texto, imagem e vídeo em uma única fatura — muitos agregadores são só texto; (2) checkout nativo Stripe, ACH, SEPA, Apple Pay, WeChat Pay tudo incluso — sem faturas fora da plataforma; (3) transparência total no routing — nunca trocamos silenciosamente seu modelo por um mais barato.
Cada modelo está cerca de 30–70 % abaixo do preço oficial do provedor — e recargas maiores liberam bônus adicional. Você também economiza operacionalmente: um contrato, uma fatura, um SDK, sem mínimo de compromisso. O preço por 1 M de tokens de cada modelo está publicado em /pricing — comparável com o listing upstream a qualquer momento.
Sim. Implementamos o conjunto completo de endpoints da OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models e /v1/video/generations. Streaming, function calling, vision e tool use se comportam identicamente. Projetos que usam o SDK da OpenAI migram trocando base_url — é só isso.
Não. O Kunavo é uma carteira pré-paga. Recargas permanecem na sua conta para sempre — sem assinatura, sem mínimo mensal, sem expiração. Fechamento de conta reembolsa o saldo restante no método de pagamento original.
Nunca. Respostas 4xx e 5xx não são cobradas. Respostas em streaming que desconectam no meio são cobradas apenas pelos tokens efetivamente entregues. Cada cobrança é visível call-by-call no dashboard de uso e exportável em CSV para contabilidade.
Tudo que o Stripe suporta: cartões (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay e mais. Auto-recharge é opt-in. Clientes Enterprise podem pagar por fatura com prazos Net 30.
Nós edge gateway rodam em América do Norte, Europa e Ásia-Pacífico. Lógica de routing stateless roda na borda, com latência P50 abaixo de 120 ms. Dados de billing, contas e logs de auditoria ficam em uma região primária com replicação multi-região.

Três minutos até sua primeira chamada.

Uma única API compatível com OpenAI para Claude, Gemini, GPT-Image e mais 200+ — recarga mínima de $5, você paga só pelo que chamar.

Começar Ler o quickstart