Gemini API fiyatlandırma 2026 — model bazlı fiyatlar ve maliyeti düşürme

Q: Gemini API ücretsiz mi?

Google AI Studio, prototipleme için hız sınırlı bir ücretsiz katman sunar. Üretim için token başına ödeme yaparsınız. Kunavo, $5 minimum yükleme ile kullandıkça öde modeliyle çalışır — aşağıdaki oranlardan token başına ödersiniz, bakiye asla sona ermez ve Google Cloud faturalandırma hesabına gerek yoktur.

Q: Gemini 2.5 Flash ne kadar?

Kunavo'da Gemini 2.5 Flash, 1M girdi token başına $0.09 ve 1M çıktı token başına $0.75 — Google'ın $0.30 / $2.50 liste fiyatının yaklaşık %70 altında. Tipik bir sohbet turu (1K girdi, 300 çıktı) yaklaşık $0.0003 tutar.

Q: Gemini, Claude veya GPT'den daha mı ucuz?

Gemini 2.5 Flash, mevcut en ucuz yetenekli modellerden biridir — yüksek hacimli işlerde Claude Haiku'nun ve çoğu GPT katmanının altında kalır. Gemini 2.5 Pro ise maliyet açısından Claude Haiku ile Sonnet arasında yer alırken çok geniş bir bağlam penceresi sunar.

Q: Gemini API maliyetini nasıl düşürürüm?

Basit görevler için gemini-2-5-flash'a inin, çıktı token sayısını sınırlayın, bağımsız istekleri yığınlayın ve sabit bağlamı yeniden kullanın. Bunları üst üste koymak, Gemini faturasını genellikle kalite kaybı olmadan yarıdan fazla düşürür.

Gemini, sınır AI'da en iyi fiyat/performans seçeneklerinden biridir ve Kunavo onu tek bir OpenAI-uyumlu API arkasında Google'ın liste fiyatının yaklaşık %70 altında fiyatlandırır. Bu rehber güncel model bazlı oranları, kendiniz doğrulayabileceğiniz örnek maliyet hesaplarını ve Gemini'yi üretimde çağırmanın en ucuz yolunu verir.

Bir bakışta Gemini fiyatlandırma

Oranlar, Kunavo'da faturalandırıldığı şekilde, 1M token başına ve USD cinsindendir. “Google liste” sütunu, aynı modelin Google'ın yayınladığı orandır; farkı görebilmeniz için gösterilir.

Model	Girdi / 1M	Çıktı / 1M	Google liste (girdi / çıktı)	Tasarruf
`gemini-2-5-flash`	$0.09	$0.75	$0.30 / $2.50	~%70
`gemini-2-5-pro`	$0.375	$3.00	$1.25 / $10.00	~%70

Flash, yüksek hacimli iş gücüdür; Pro ise daha zor akıl yürütme, görsel ve uzun bağlam işleri içindir. Canlı oranlar her zaman fiyatlandırma sayfasında ve her model sayfasında görünür (gemini-2-5-flash, gemini-2-5-pro).

Gemini token fiyatlandırması nasıl çalışır

Girdi token'ları (gönderdiğiniz her şey — sistem istemi, getirilen bağlam, kullanıcı mesajı) ve çıktı token'ları (modelin ürettiği) için ödeme yaparsınız. Çıktı daha pahalı taraftır; bu yüzden Gemini faturasındaki en büyük tek kaldıraç, modelin ne kadar metin yazmasına izin verdiğinizdir. Görseller ve ses, token eşdeğerlerine dönüştürülür ve aynı sayaçtan faturalandırılır.

Örnek maliyet hesapları

Son satır hariç Kunavo'nun Gemini 2.5 Flash oranıyla gerçek rakamlar; son satır Gemini 2.5 Pro kullanır:

İş yükü	Token (girdi / çıktı)	Model	Maliyet
Sohbet turu	1.000 / 300	Flash	$0.0003
RAG yanıtı	8.000 / 500	Flash	$0.0011
Yığın sınıflandırma (belge başına)	500 / 20	Flash	$0.00006
Uzun bağlam analizi	20.000 / 2.000	Pro	$0.0135

Bu oranlarda Flash üzerinde 100.000 belgelik bir sınıflandırma yığını yaklaşık $6, bir milyon sohbet turu ise yaklaşık $315 tutar. Çalıştırılabilir matematik:

gemini_cost.py

# Kunavo Gemini 2.5 Flash oranları (1M token başına USD)
IN_RATE, OUT_RATE = 0.09, 0.75

def cost(in_tokens: int, out_tokens: int) -> float:
    return in_tokens / 1_000_000 * IN_RATE + out_tokens / 1_000_000 * OUT_RATE

print(cost(1_000, 300))            # bir sohbet turu     -> $0.000315
print(cost(8_000, 500))            # bir RAG yanıtı       -> $0.001095
print(cost(500, 20) * 100_000)     # 100k belge yığını    -> ~$6.00

Kunavo fiyatlandırması ve Stripe faturalandırması

Abonelik yok, Google Cloud projesi yok. Bir bakiye yüklersiniz (Stripe veya yerel ödeme yöntemleri) ve çağrılar yukarıdaki token başına oranlardan bu bakiyeden düşülür. $5 minimum yükleme ile kullandıkça öde, bakiye asla sona ermez ve daha büyük yüklemeler bonus kredi getirir. Tek bir bakiye Gemini ve diğer her modeli kapsar — Claude, GPT, görsel, video ve ses — böylece sağlayıcı başına ayrı bir fatura mutabakatı yapmazsınız.

Hangi Gemini modelini seçmeliyim?

gemini-2-5-flash — sohbet, çıkarım, sınıflandırma, özetleme ve çoğu RAG için varsayılan. Hızlı ve en ucuz yetenekli seçenek.
gemini-2-5-pro — Flash yeterince doğru olmadığında başvurun: çok adımlı akıl yürütme, kod, görsel ve çok uzun bağlam.

İyi bir desen, zorluğa göre yönlendirmektir: yaygın durum için Flash, bir kontrol başarısız olduğunda Pro'ya yükseltin. Koddaki yönlendirme deseni için AI maliyet optimizasyonu rehberine bakın.

Gemini faturanızı düşürmek

Katman düşürün. Kolay %80'i Flash'a gönderin; Pro'yu zor %20 için ayırın.
Çıktıyı sınırlayın. max_tokens ve durdurma dizileri ayarlayın — çıktı, sayacın pahalı tarafıdır.
Girdiyi kırpın. Tüm bilgi tabanını bağlama doldurmak yerine daha az ama daha iyi RAG parçası getirin.
Yığınlayın. Gecikmeyi düşük tutmak ve yeniden deneme fırtınalarından kaçınmak için bağımsız çağrıları gruplayın.

SSS

Gemini API ücretsiz mi?

Google AI Studio'nun prototipleme için hız sınırlı bir ücretsiz katmanı vardır; üretim token başına ödemelidir. Kunavo, $5 minimum yükleme ile kullandıkça öde modeliyle çalışır — yukarıdaki token başına oranları ödersiniz, bakiye asla sona ermez ve Google Cloud faturalandırma hesabına gerek yoktur.

Gemini 2.5 Flash ne kadar?

Kunavo'da 1M girdi token başına $0.09 ve 1M çıktı token başına $0.75 — Google'ın $0.30 / $2.50 liste fiyatının yaklaşık %70 altında. Tipik bir sohbet turu kabaca $0.0003 tutar.

Gemini, Claude veya GPT'den daha mı ucuz?

Gemini 2.5 Flash, herhangi bir yerdeki en ucuz yetenekli modellerden biridir — yüksek hacimli işlerde Claude Haiku'nun ve çoğu GPT katmanının altında kalır. Tam tabloyu fiyatlandırma sayfasında karşılaştırın.

Gemini API maliyetini nasıl düşürürüm?

Flash'a inin, çıktıyı sınırlayın, getirilen bağlamı kırpın ve yığınlayın. Ayrıntılar maliyet optimizasyonu rehberinde. Gemini'yi çağırmaya başlamak için Gemini API anahtarı alma rehberine bakın.