Torna al catalogoLettura cache $0.07
Google·Text30 % sotto l'ufficiale
Gemini 3 FlashAPI
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Prezzo input
$0.35
per 1M tokens
Prezzo output
$2.10
per 1M tokens
Prompt caching
Passa cache_control sui prefix stabili — gli hit di cache vengono fatturati a una frazione del prezzo di input. Le scritture di cache restano alla tariffa di input normale.
Calcolato automaticamente come input × 0.2
Specifiche
- ID modello
gemini-3-flash- Endpoint
POST /v1/chat/completions- Categoria
- Text
- Provider
- Capability
- visionfunctionstreaming
Compatibilità OpenAI drop-in
Punta il tuo SDK OpenAI esistente a api.kunavo.com/v1 e sostituisci l'ID del modello. Niente cambi di streaming, nessun nuovo SDK.
Vedi la docProvalo tu stesso
Imposta KUNAVO_API_KEY da /app/keys ed esegui lo snippet sotto.
curl
curl https://api.kunavo.com/v1/chat/completions \
-H "Authorization: Bearer $KUNAVO_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3-flash",
"messages": [
{"role": "user", "content": "Hello, Gemini 3 Flash"}
],
"stream": false
}'