O Sora é o modelo de texto-para-vídeo da OpenAI, e “a API Sora” é como as equipes geram vídeo de forma programática em vez de pelo app de consumo. Na Kunavo hoje, a geração de texto-para-vídeo roda no Google Veo 3 por um único endpoint de vídeo no estilo OpenAI — o acesso ao Sora está no roadmap, e como o endpoint é agnóstico ao modelo, migrar para o Sora depois é uma mudança de uma só palavra. Este guia mostra o fluxo de trabalho com o Veo 3 para que todo exemplo funcione agora.
O que é a API Sora?
O Sora (Sora 2 e Sora 2 Pro) transforma um prompt de texto — ou uma imagem estática — em um clipe curto de vídeo, com áudio sincronizado no Sora 2. A forma de API permite roteirizar a geração dentro de um pipeline: tomadas de marketing, animações de produto, b-roll, prévias de storyboard. O formato é o mesmo entre os modelos de vídeo modernos: você envia um prompt e parâmetros e recebe de volta a URL de um vídeo hospedado.
Vídeo na Kunavo hoje: Veo 3
A Kunavo expõe a geração de vídeo por um único endpoint no estilo OpenAI, /v1/video/generations. O Sora ainda não está habilitado no catálogo; o modelo de texto-para-vídeo ao vivo é o Google Veo 3, que produz clipes cinematográficos com áudio nativo. Os exemplos abaixo usam veo-3 — quando o Sora chegar, a única mudança será o campo model.
Quickstart de texto-para-vídeo
Um POST com sua chave Kunavo. A geração pode levar alguns minutos, então a chamada síncrona mantém a conexão aberta até o clipe ficar pronto:
import requests
resp = requests.post(
"https://api.kunavo.com/v1/video/generations",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "veo-3",
"prompt": "um dolly-in cinematográfico em um origami de garça vermelha se abrindo, luz suave",
"duration": 5,
"aspect_ratio": "16:9",
},
timeout=600, # a geração pode levar minutos
)
print(resp.json()["data"][0]["url"])Imagem-para-vídeo
Para animar uma imagem estática, passe image_url (uma URL https ou um arquivo enviado a /v1/files) junto com o prompt. Para movimento controlado, você pode passar um primeiro e um último quadro com image_urls e image_mode: "frame". Há exemplos completos na documentação de vídeo.
Ciclo de vida da tarefa assíncrona
Em produção, não segure uma conexão de 10 minutos. Envie uma tarefa para /v1/videos, receba um id de tarefa de imediato e então faça polling em GET /v1/videos/{id} até concluir. As URLs de resultado são permanentes.
# Produção: envie uma tarefa e faça polling — sem conexão de longa duração.
task = requests.post(
"https://api.kunavo.com/v1/videos",
headers={
"Authorization": f"Bearer {API_KEY}",
"Idempotency-Key": "meu-uuid-de-tarefa", # seguro para retry em ~24h
},
json={"model": "veo-3", "prompt": "...", "duration": 5, "aspect_ratio": "16:9"},
timeout=60,
).json()
# depois faça polling em GET /v1/videos/{task["id"]} até concluirA documentação de vídeo cobre o loop completo de polling, chaves de idempotência e entrega por webhook.
Preços
O Veo 3 é cobrado por vídeo (por clipe de 8 segundos em 720p, mostrado aqui), cerca de 40–60% abaixo do preço de lista do Google. Resoluções maiores custam mais — veja a página de preços para a tabela completa de faixas.
| Modelo | A partir de (720p / 8s) | Lista do Google | Você economiza |
|---|---|---|---|
veo-3-lite | $0.16 | $0.40 | ~60% |
veo-3 (Fast) | $0.32 | $0.80 | ~60% |
veo-3-quality | $1.92 | $3.20 | ~40% |
Dicas de prompt para vídeo
- Descreva a tomada, não só o sujeito. Movimento de câmera (dolly, pan, push-in), sensação de lente, iluminação e ritmo importam mais do que adjetivos.
- Defina a proporção explicitamente —
16:9para paisagem,9:16para vertical/redes sociais. - Mantenha os clipes curtos. 5–8 segundos é o ponto ideal; costure várias gerações para sequências mais longas.
- Use um quadro de referência (imagem-para-vídeo) quando precisar que um personagem ou produto específico se mantenha consistente.
FAQ
Dá para usar a API Sora na Kunavo hoje?
Ainda não — o Sora não está habilitado no catálogo. A geração de texto-para-vídeo roda hoje no Veo 3 pelo mesmo endpoint no estilo OpenAI, e migrar para o Sora depois é uma mudança de uma só palavra no campo model. O acesso ao Sora está no roadmap.
Quanto custa gerar vídeo?
O Veo 3 é por vídeo, cerca de 40–60% abaixo da lista do Google: Lite a partir de $0.16, Fast a partir de $0.32, Quality a partir de $1.92 por clipe de 8s em 720p.
A Kunavo suporta imagem-para-vídeo?
Sim — passe image_url para /v1/video/generations, ou um par de primeiro/último quadro para transições controladas.
Quanto tempo leva a geração?
Minutos. Em produção, use a API de tarefas assíncronas /v1/videos e faça polling; veja a documentação de vídeo. Para preços do Gemini e modelos de texto, veja o guia de preços da API Gemini.