Gemini, sınır AI'da en iyi fiyat/performans seçeneklerinden biridir ve Kunavo onu tek bir OpenAI-uyumlu API arkasında Google'ın liste fiyatının yaklaşık %70 altında fiyatlandırır. Bu rehber güncel model bazlı oranları, kendiniz doğrulayabileceğiniz örnek maliyet hesaplarını ve Gemini'yi üretimde çağırmanın en ucuz yolunu verir.
Bir bakışta Gemini fiyatlandırma
Oranlar, Kunavo'da faturalandırıldığı şekilde, 1M token başına ve USD cinsindendir. “Google liste” sütunu, aynı modelin Google'ın yayınladığı orandır; farkı görebilmeniz için gösterilir.
| Model | Girdi / 1M | Çıktı / 1M | Google liste (girdi / çıktı) | Tasarruf |
|---|---|---|---|---|
gemini-2-5-flash | $0.09 | $0.75 | $0.30 / $2.50 | ~%70 |
gemini-2-5-pro | $0.375 | $3.00 | $1.25 / $10.00 | ~%70 |
Flash, yüksek hacimli iş gücüdür; Pro ise daha zor akıl yürütme, görsel ve uzun bağlam işleri içindir. Canlı oranlar her zaman fiyatlandırma sayfasında ve her model sayfasında görünür (gemini-2-5-flash, gemini-2-5-pro).
Gemini token fiyatlandırması nasıl çalışır
Girdi token'ları (gönderdiğiniz her şey — sistem istemi, getirilen bağlam, kullanıcı mesajı) ve çıktı token'ları (modelin ürettiği) için ödeme yaparsınız. Çıktı daha pahalı taraftır; bu yüzden Gemini faturasındaki en büyük tek kaldıraç, modelin ne kadar metin yazmasına izin verdiğinizdir. Görseller ve ses, token eşdeğerlerine dönüştürülür ve aynı sayaçtan faturalandırılır.
Örnek maliyet hesapları
Son satır hariç Kunavo'nun Gemini 2.5 Flash oranıyla gerçek rakamlar; son satır Gemini 2.5 Pro kullanır:
| İş yükü | Token (girdi / çıktı) | Model | Maliyet |
|---|---|---|---|
| Sohbet turu | 1.000 / 300 | Flash | $0.0003 |
| RAG yanıtı | 8.000 / 500 | Flash | $0.0011 |
| Yığın sınıflandırma (belge başına) | 500 / 20 | Flash | $0.00006 |
| Uzun bağlam analizi | 20.000 / 2.000 | Pro | $0.0135 |
Bu oranlarda Flash üzerinde 100.000 belgelik bir sınıflandırma yığını yaklaşık $6, bir milyon sohbet turu ise yaklaşık $315 tutar. Çalıştırılabilir matematik:
# Kunavo Gemini 2.5 Flash oranları (1M token başına USD)
IN_RATE, OUT_RATE = 0.09, 0.75
def cost(in_tokens: int, out_tokens: int) -> float:
return in_tokens / 1_000_000 * IN_RATE + out_tokens / 1_000_000 * OUT_RATE
print(cost(1_000, 300)) # bir sohbet turu -> $0.000315
print(cost(8_000, 500)) # bir RAG yanıtı -> $0.001095
print(cost(500, 20) * 100_000) # 100k belge yığını -> ~$6.00Kunavo fiyatlandırması ve Stripe faturalandırması
Abonelik yok, Google Cloud projesi yok. Bir bakiye yüklersiniz (Stripe veya yerel ödeme yöntemleri) ve çağrılar yukarıdaki token başına oranlardan bu bakiyeden düşülür. $5 minimum yükleme ile kullandıkça öde, bakiye asla sona ermez ve daha büyük yüklemeler bonus kredi getirir. Tek bir bakiye Gemini ve diğer her modeli kapsar — Claude, GPT, görsel, video ve ses — böylece sağlayıcı başına ayrı bir fatura mutabakatı yapmazsınız.
Hangi Gemini modelini seçmeliyim?
- gemini-2-5-flash — sohbet, çıkarım, sınıflandırma, özetleme ve çoğu RAG için varsayılan. Hızlı ve en ucuz yetenekli seçenek.
- gemini-2-5-pro — Flash yeterince doğru olmadığında başvurun: çok adımlı akıl yürütme, kod, görsel ve çok uzun bağlam.
İyi bir desen, zorluğa göre yönlendirmektir: yaygın durum için Flash, bir kontrol başarısız olduğunda Pro'ya yükseltin. Koddaki yönlendirme deseni için AI maliyet optimizasyonu rehberine bakın.
Gemini faturanızı düşürmek
- Katman düşürün. Kolay %80'i Flash'a gönderin; Pro'yu zor %20 için ayırın.
- Çıktıyı sınırlayın.
max_tokensve durdurma dizileri ayarlayın — çıktı, sayacın pahalı tarafıdır. - Girdiyi kırpın. Tüm bilgi tabanını bağlama doldurmak yerine daha az ama daha iyi RAG parçası getirin.
- Yığınlayın. Gecikmeyi düşük tutmak ve yeniden deneme fırtınalarından kaçınmak için bağımsız çağrıları gruplayın.
SSS
Gemini API ücretsiz mi?
Google AI Studio'nun prototipleme için hız sınırlı bir ücretsiz katmanı vardır; üretim token başına ödemelidir. Kunavo, $5 minimum yükleme ile kullandıkça öde modeliyle çalışır — yukarıdaki token başına oranları ödersiniz, bakiye asla sona ermez ve Google Cloud faturalandırma hesabına gerek yoktur.
Gemini 2.5 Flash ne kadar?
Kunavo'da 1M girdi token başına $0.09 ve 1M çıktı token başına $0.75 — Google'ın $0.30 / $2.50 liste fiyatının yaklaşık %70 altında. Tipik bir sohbet turu kabaca $0.0003 tutar.
Gemini, Claude veya GPT'den daha mı ucuz?
Gemini 2.5 Flash, herhangi bir yerdeki en ucuz yetenekli modellerden biridir — yüksek hacimli işlerde Claude Haiku'nun ve çoğu GPT katmanının altında kalır. Tam tabloyu fiyatlandırma sayfasında karşılaştırın.
Gemini API maliyetini nasıl düşürürüm?
Flash'a inin, çıktıyı sınırlayın, getirilen bağlamı kırpın ve yığınlayın. Ayrıntılar maliyet optimizasyonu rehberinde. Gemini'yi çağırmaya başlamak için Gemini API anahtarı alma rehberine bakın.