Retour au catalogueLecture cache $0.07
Google·Text30 % sous l'officiel
Gemini 3 FlashAPI
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Tarif input
$0.35
per 1M tokens
Tarif output
$2.10
per 1M tokens
Prompt caching
Passez cache_control sur les préfixes stables — les hits de cache sont facturés à une fraction du tarif d'input. Les écritures restent au tarif d'input normal.
Calculé automatiquement comme input × 0.2
Spécifications
- ID du modèle
gemini-3-flash- Endpoint
POST /v1/chat/completions- Catégorie
- Text
- Fournisseur
- Capacités
- visionfunctionstreaming
Compatibilité OpenAI drop-in
Pointez votre SDK OpenAI existant sur api.kunavo.com/v1 et changez l'ID du modèle. Pas de changement de streaming, pas de nouveau SDK.
Voir la docEssayez vous-même
Récupérez KUNAVO_API_KEY depuis /app/keys puis exécutez le snippet ci-dessous.
curl
curl https://api.kunavo.com/v1/chat/completions \
-H "Authorization: Bearer $KUNAVO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3-flash",
"messages": [
{"role": "user", "content": "Hello, Gemini 3 Flash"}
],
"stream": false
}'