Quay lại danh mục
Google·Text70%+ dưới giá chính thức

Gemini 2.5 FlashAPI

Previous-gen Gemini Flash — extreme value.

Giá input

$0.09

per 1M tokens

Giá output

$0.75

per 1M tokens

Prompt caching

Truyền cache_control trên các tiền tố ổn định — hit cache được tính bằng một phần nhỏ giá input. Ghi cache luôn theo giá input bình thường.

Đọc cache
$0.018

Được tính tự động bằng input × 0.2

Thông số kỹ thuật

ID mô hình
gemini-2-5-flash
Endpoint
POST /v1/chat/completions
Danh mục
Text
Nhà cung cấp
Google
Khả năng
visionfunctionstreaming

Tương thích drop-in với OpenAI

Trỏ SDK OpenAI của bạn tới api.kunavo.com/v1 và đổi ID mô hình. Không thay đổi streaming, không SDK mới.

Xem tài liệu

Tự mình thử

Thiết lập KUNAVO_API_KEY từ /app/keys và chạy đoạn mã bên dưới.

curl
curl https://api.kunavo.com/v1/chat/completions \
  -H "Authorization: Bearer $KUNAVO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2-5-flash",
    "messages": [
      {"role": "user", "content": "Hello, Gemini 2.5 Flash"}
    ],
    "stream": false
  }'

FAQ

How much does Gemini 2.5 Flash cost?

On Kunavo, Gemini 2.5 Flash is $0.09 per 1M input tokens and $0.75 per 1M output tokens — about 70% under Google's official price. Failed requests are never billed, and it's pay-as-you-go — you only pay for successful calls.

Can I call Gemini 2.5 Flash with the OpenAI SDK?

Yes. Set base_url to https://api.kunavo.com/v1, pass your Kunavo key, and set model to "gemini-2-5-flash". Requests and responses are OpenAI-compatible.

What endpoint does Gemini 2.5 Flash use?

Gemini 2.5 Flash is called via POST /v1/chat/completions on Kunavo's OpenAI-compatible API.

What is Gemini 2.5 Flash good for?

Gemini 2.5 Flash is a text model from Google, with support for vision, function, streaming.