Back to guides
Fiyatlandırma·June 18, 2026·8 min read

Gemini API fiyatlandırma 2026 — model bazlı fiyatlar ve maliyeti düşürme

Gemini fiyatlandırmasının net tablosu: model bazlı oranlar, gerçek dünya maliyet örnekleri ve Gemini'yi üretimde token başına en az fiyata çağırmanın yolu. Tüm rakamlar Kunavo'nun faturalandırdığı oranlardır.

Gemini, sınır AI'da en iyi fiyat/performans seçeneklerinden biridir ve Kunavo onu tek bir OpenAI-uyumlu API arkasında Google'ın liste fiyatının yaklaşık %70 altında fiyatlandırır. Bu rehber güncel model bazlı oranları, kendiniz doğrulayabileceğiniz örnek maliyet hesaplarını ve Gemini'yi üretimde çağırmanın en ucuz yolunu verir.

Bir bakışta Gemini fiyatlandırma

Oranlar, Kunavo'da faturalandırıldığı şekilde, 1M token başına ve USD cinsindendir. “Google liste” sütunu, aynı modelin Google'ın yayınladığı orandır; farkı görebilmeniz için gösterilir.

ModelGirdi / 1MÇıktı / 1MGoogle liste (girdi / çıktı)Tasarruf
gemini-2-5-flash$0.09$0.75$0.30 / $2.50~%70
gemini-2-5-pro$0.375$3.00$1.25 / $10.00~%70

Flash, yüksek hacimli iş gücüdür; Pro ise daha zor akıl yürütme, görsel ve uzun bağlam işleri içindir. Canlı oranlar her zaman fiyatlandırma sayfasında ve her model sayfasında görünür (gemini-2-5-flash, gemini-2-5-pro).

Gemini token fiyatlandırması nasıl çalışır

Girdi token'ları (gönderdiğiniz her şey — sistem istemi, getirilen bağlam, kullanıcı mesajı) ve çıktı token'ları (modelin ürettiği) için ödeme yaparsınız. Çıktı daha pahalı taraftır; bu yüzden Gemini faturasındaki en büyük tek kaldıraç, modelin ne kadar metin yazmasına izin verdiğinizdir. Görseller ve ses, token eşdeğerlerine dönüştürülür ve aynı sayaçtan faturalandırılır.

Örnek maliyet hesapları

Son satır hariç Kunavo'nun Gemini 2.5 Flash oranıyla gerçek rakamlar; son satır Gemini 2.5 Pro kullanır:

İş yüküToken (girdi / çıktı)ModelMaliyet
Sohbet turu1.000 / 300Flash$0.0003
RAG yanıtı8.000 / 500Flash$0.0011
Yığın sınıflandırma (belge başına)500 / 20Flash$0.00006
Uzun bağlam analizi20.000 / 2.000Pro$0.0135

Bu oranlarda Flash üzerinde 100.000 belgelik bir sınıflandırma yığını yaklaşık $6, bir milyon sohbet turu ise yaklaşık $315 tutar. Çalıştırılabilir matematik:

gemini_cost.py
# Kunavo Gemini 2.5 Flash oranları (1M token başına USD)
IN_RATE, OUT_RATE = 0.09, 0.75

def cost(in_tokens: int, out_tokens: int) -> float:
    return in_tokens / 1_000_000 * IN_RATE + out_tokens / 1_000_000 * OUT_RATE

print(cost(1_000, 300))            # bir sohbet turu     -> $0.000315
print(cost(8_000, 500))            # bir RAG yanıtı       -> $0.001095
print(cost(500, 20) * 100_000)     # 100k belge yığını    -> ~$6.00

Kunavo fiyatlandırması ve Stripe faturalandırması

Abonelik yok, Google Cloud projesi yok. Bir bakiye yüklersiniz (Stripe veya yerel ödeme yöntemleri) ve çağrılar yukarıdaki token başına oranlardan bu bakiyeden düşülür. $5 minimum yükleme ile kullandıkça öde, bakiye asla sona ermez ve daha büyük yüklemeler bonus kredi getirir. Tek bir bakiye Gemini ve diğer her modeli kapsar — Claude, GPT, görsel, video ve ses — böylece sağlayıcı başına ayrı bir fatura mutabakatı yapmazsınız.

Hangi Gemini modelini seçmeliyim?

  • gemini-2-5-flash — sohbet, çıkarım, sınıflandırma, özetleme ve çoğu RAG için varsayılan. Hızlı ve en ucuz yetenekli seçenek.
  • gemini-2-5-pro — Flash yeterince doğru olmadığında başvurun: çok adımlı akıl yürütme, kod, görsel ve çok uzun bağlam.

İyi bir desen, zorluğa göre yönlendirmektir: yaygın durum için Flash, bir kontrol başarısız olduğunda Pro'ya yükseltin. Koddaki yönlendirme deseni için AI maliyet optimizasyonu rehberine bakın.

Gemini faturanızı düşürmek

  1. Katman düşürün. Kolay %80'i Flash'a gönderin; Pro'yu zor %20 için ayırın.
  2. Çıktıyı sınırlayın. max_tokens ve durdurma dizileri ayarlayın — çıktı, sayacın pahalı tarafıdır.
  3. Girdiyi kırpın. Tüm bilgi tabanını bağlama doldurmak yerine daha az ama daha iyi RAG parçası getirin.
  4. Yığınlayın. Gecikmeyi düşük tutmak ve yeniden deneme fırtınalarından kaçınmak için bağımsız çağrıları gruplayın.

SSS

Gemini API ücretsiz mi?

Google AI Studio'nun prototipleme için hız sınırlı bir ücretsiz katmanı vardır; üretim token başına ödemelidir. Kunavo, $5 minimum yükleme ile kullandıkça öde modeliyle çalışır — yukarıdaki token başına oranları ödersiniz, bakiye asla sona ermez ve Google Cloud faturalandırma hesabına gerek yoktur.

Gemini 2.5 Flash ne kadar?

Kunavo'da 1M girdi token başına $0.09 ve 1M çıktı token başına $0.75 — Google'ın $0.30 / $2.50 liste fiyatının yaklaşık %70 altında. Tipik bir sohbet turu kabaca $0.0003 tutar.

Gemini, Claude veya GPT'den daha mı ucuz?

Gemini 2.5 Flash, herhangi bir yerdeki en ucuz yetenekli modellerden biridir — yüksek hacimli işlerde Claude Haiku'nun ve çoğu GPT katmanının altında kalır. Tam tabloyu fiyatlandırma sayfasında karşılaştırın.

Gemini API maliyetini nasıl düşürürüm?

Flash'a inin, çıktıyı sınırlayın, getirilen bağlamı kırpın ve yığınlayın. Ayrıntılar maliyet optimizasyonu rehberinde. Gemini'yi çağırmaya başlamak için Gemini API anahtarı alma rehberine bakın.