Back to guides
Video·June 18, 2026·7 min read

Sora API — KI-Video generieren am OpenAI-artigen Endpoint (heute mit Veo 3)

KI-Video über die Sora API: Sora ist noch nicht aktiviert — das aktive Text-zu-Video-Modell ist Google Veo 3 am selben OpenAI-artigen Endpoint. Mit lauffähigen Beispielen und Preisen ab $0.16 pro Clip.

Sora ist OpenAIs Text-zu-Video-Modell, und “die Sora API” ist der Weg, mit dem Teams Video programmatisch erzeugen statt über die Consumer-App. Bei Kunavo läuft Text-zu-Video heute über Google Veo 3 an einem OpenAI-artigen Video-Endpoint — Sora-Zugang steht auf der Roadmap, und da der Endpoint modellunabhängig ist, ist der spätere Wechsel zu Sora eine Ein-Wort-Änderung. Diese Anleitung zeigt den Workflow mit Veo 3, damit jedes Beispiel sofort läuft.

Was ist die Sora API?

Sora (Sora 2 und Sora 2 Pro) macht aus einem Text-Prompt — oder einem Standbild — einen kurzen Videoclip, bei Sora 2 mit synchronem Ton. Die API-Form lässt Sie die Generierung in eine Pipeline skripten: Marketing-Shots, Produktanimationen, B-Roll, Storyboard-Vorschauen. Die Form ist über moderne Videomodelle hinweg gleich: Prompt und Parameter senden, eine gehostete Video-URL zurückbekommen.

Video bei Kunavo heute: Veo 3

Kunavo stellt die Videogenerierung über einen einzigen OpenAI-artigen Endpoint bereit, /v1/video/generations. Sora ist im Katalog noch nicht aktiviert; das aktive Text-zu-Video-Modell ist Google Veo 3, das cinematische Clips mit nativem Ton erzeugt. Die Beispiele unten verwenden veo-3 — wenn Sora kommt, ist die einzige Änderung das model-Feld.

Text-zu-Video Quickstart

Ein POST mit Ihrem Kunavo-Key. Die Generierung kann ein paar Minuten dauern, deshalb hält der synchrone Aufruf die Verbindung, bis der Clip fertig ist:

text_to_video.py
import requests

resp = requests.post(
    "https://api.kunavo.com/v1/video/generations",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "veo-3",
        "prompt": "a cinematic dolly-in on a red origami crane unfolding, soft light",
        "duration": 5,
        "aspect_ratio": "16:9",
    },
    timeout=600,  # die Generierung kann Minuten dauern
)
print(resp.json()["data"][0]["url"])

Bild-zu-Video

Um ein Standbild zu animieren, übergeben Sie image_url (eine https-URL oder eine Datei, die Sie nach /v1/files hochgeladen haben) zusammen mit dem Prompt. Für kontrollierte Bewegung können Sie mit image_urls und image_mode: "frame" einen ersten und letzten Frame übergeben. Vollständige Beispiele stehen in den Video-Docs.

Asynchroner Task-Lebenszyklus

In Produktion sollten Sie keine 10-Minuten-Verbindung offen halten. Reichen Sie einen Task an /v1/videos ein, bekommen Sie sofort eine Task-ID zurück und pollen Sie dann GET /v1/videos/{id}, bis er fertig ist. Ergebnis-URLs sind dauerhaft.

async_submit.py
# Produktion: Task einreichen, dann pollen — keine langlebige Verbindung.
task = requests.post(
    "https://api.kunavo.com/v1/videos",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Idempotency-Key": "my-task-uuid",   # innerhalb von ~24h retry-sicher
    },
    json={"model": "veo-3", "prompt": "...", "duration": 5, "aspect_ratio": "16:9"},
    timeout=60,
).json()
# dann GET /v1/videos/{task["id"]} pollen, bis er fertig ist

Die Video-Docs behandeln die komplette Polling-Schleife, Idempotency-Keys und Webhook-Zustellung.

Preise

Veo 3 wird pro Video abgerechnet (hier pro 8-Sekunden-Clip in 720p), rund 40–60% unter Googles Listenpreis. Höhere Auflösungen kosten mehr — die vollständige Stufen-Tabelle steht auf der Preisseite.

ModellAb (720p / 8s)Google-ListeSie sparen
veo-3-lite$0.16$0.40~60%
veo-3 (Fast)$0.32$0.80~60%
veo-3-quality$1.92$3.20~40%

Prompting-Tipps für Video

  • Beschreiben Sie die Einstellung, nicht nur das Motiv. Kamerabewegung (Dolly, Schwenk, Push-in), Objektivanmutung, Beleuchtung und Tempo zählen mehr als Adjektive.
  • Setzen Sie das Seitenverhältnis explizit 16:9 für Querformat, 9:16 für Hochformat/Social.
  • Halten Sie Clips kurz. 5–8 Sekunden sind der Sweet-Spot; fügen Sie für längere Sequenzen mehrere Generierungen aneinander.
  • Nutzen Sie einen Referenz-Frame (Bild-zu-Video), wenn eine bestimmte Figur oder ein Produkt konsistent bleiben soll.

FAQ

Kann ich die Sora API heute bei Kunavo nutzen?

Noch nicht — Sora ist im Katalog nicht aktiviert. Text-zu-Video läuft heute über Veo 3 am selben OpenAI-artigen Endpoint, und der spätere Wechsel zu Sora ist eine Ein-Wort-Änderung am model-Feld. Sora-Zugang steht auf der Roadmap.

Was kostet die Videogenerierung?

Veo 3 wird pro Video abgerechnet, rund 40–60% unter Googles Liste: Lite ab $0.16, Fast ab $0.32, Quality ab $1.92 pro 8s-Clip in 720p.

Unterstützt Kunavo Bild-zu-Video?

Ja — übergeben Sie image_url an /v1/video/generations oder ein Paar aus erstem und letztem Frame für kontrollierte Übergänge.

Wie lange dauert die Generierung?

Minuten. Nutzen Sie in Produktion die asynchrone /v1/videos-Task-API und pollen Sie; siehe die Video-Docs. Die Tarife pro Modell stehen auch im Leitfaden zu den Gemini API Preisen.