Retour au catalogueLecture cache $0.045
OpenAI·Text70 %+ sous l'officiel
GPT-5.4 MiniAPI
OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.
Tarif input
$0.225
per 1M tokens
Tarif output
$1.35
per 1M tokens
Prompt caching
Passez cache_control sur les préfixes stables — les hits de cache sont facturés à une fraction du tarif d'input. Les écritures restent au tarif d'input normal.
Calculé automatiquement comme input × 0.2
Spécifications
- ID du modèle
gpt-5-4-mini- Endpoint
POST /v1/chat/completions- Catégorie
- Text
- Fournisseur
- OpenAI
- Capacités
- functionstreamingthinking
Compatibilité OpenAI drop-in
Pointez votre SDK OpenAI existant sur api.kunavo.com/v1 et changez l'ID du modèle. Pas de changement de streaming, pas de nouveau SDK.
Voir la docEssayez vous-même
Récupérez KUNAVO_API_KEY depuis /app/keys puis exécutez le snippet ci-dessous.
curl
curl https://api.kunavo.com/v1/chat/completions \
-H "Authorization: Bearer $KUNAVO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5-4-mini",
"messages": [
{"role": "user", "content": "Hello, GPT-5.4 Mini"}
],
"stream": false
}'