Retour au catalogue
Google·Text30 % sous l'officiel

Gemini 3 FlashAPI

Cost-efficient Gemini — millisecond responses for high-frequency calls.

Tarif input

$0.35

per 1M tokens

Tarif output

$2.10

per 1M tokens

Prompt caching

Passez cache_control sur les préfixes stables — les hits de cache sont facturés à une fraction du tarif d'input. Les écritures restent au tarif d'input normal.

Lecture cache
$0.07

Calculé automatiquement comme input × 0.2

Spécifications

ID du modèle
gemini-3-flash
Endpoint
POST /v1/chat/completions
Catégorie
Text
Fournisseur
Google
Capacités
visionfunctionstreaming

Compatibilité OpenAI drop-in

Pointez votre SDK OpenAI existant sur api.kunavo.com/v1 et changez l'ID du modèle. Pas de changement de streaming, pas de nouveau SDK.

Voir la doc

Essayez vous-même

Récupérez KUNAVO_API_KEY depuis /app/keys puis exécutez le snippet ci-dessous.

curl
curl https://api.kunavo.com/v1/chat/completions \
  -H "Authorization: Bearer $KUNAVO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3-flash",
    "messages": [
      {"role": "user", "content": "Hello, Gemini 3 Flash"}
    ],
    "stream": false
  }'