Harga Gemini API 2026 — biaya per model, contoh, dan akses kompatibel-OpenAI yang lebih murah

Q: Apakah Gemini API gratis?

Google AI Studio punya tier gratis dengan batas laju, cocok untuk prototipe. Untuk produksi Anda membayar per token. Kunavo menerapkan pay-as-you-go mulai dari top-up minimum $5 — Anda membayar per token dengan tarif di bawah, saldo tidak pernah hangus, dan tidak perlu akun billing Google Cloud.

Q: Berapa harga Gemini 2.5 Flash?

Di Kunavo, Gemini 2.5 Flash berharga $0.09 per 1J token masukan dan $0.75 per 1J token keluaran — sekitar 70% di bawah harga list resmi Google sebesar $0.30 / $2.50. Satu putaran chatbot biasa (1rb masuk, 300 keluar) berbiaya sekitar $0.0003.

Q: Bagaimana cara menekan biaya Gemini API?

Gunakan gemini-2-5-flash untuk tugas sederhana, batasi token keluaran, gabungkan permintaan independen dalam batch, dan pakai ulang konteks yang stabil. Menggabungkan praktik ini biasanya memangkas tagihan Gemini lebih dari separuhnya tanpa menurunkan kualitas.

Gemini termasuk yang paling bernilai di antara AI papan atas, dan Kunavo menyediakannya sekitar 70% di bawah harga list resmi Google di balik satu API yang kompatibel dengan OpenAI. Panduan ini memuat tarif terkini per model, contoh biaya yang bisa Anda cek sendiri, dan cara termurah memanggil Gemini di produksi.

Harga Gemini API sekilas

Tarif dihitung per 1J token, dalam USD, sebagaimana ditagih di Kunavo. Kolom “List Google” adalah tarif resmi yang dipublikasikan Google untuk model yang sama, ditampilkan agar Anda melihat selisihnya.

Model	Masukan / 1J	Keluaran / 1J	List Google (masuk / keluar)	Anda hemat
`gemini-2-5-flash`	$0.09	$0.75	$0.30 / $2.50	~70%
`gemini-2-5-pro`	$0.375	$3.00	$1.25 / $10.00	~70%

Flash adalah kuda beban untuk volume tinggi; Pro untuk penalaran yang lebih berat, visi, dan tugas konteks panjang. Tarif langsung selalu tampil di halaman harga dan di halaman setiap model (gemini-2-5-flash, gemini-2-5-pro).

Bagaimana harga per token Gemini bekerja

Anda membayar token masukan (semua yang Anda kirim — prompt sistem, konteks hasil pencarian, pesan pengguna) dan token keluaran (yang dihasilkan model). Keluaran adalah sisi yang lebih mahal, jadi tuas terbesar pada tagihan Gemini adalah seberapa banyak teks yang Anda biarkan model tulis. Gambar dan audio dikonversi menjadi padanan token dan ditagih pada meteran yang sama.

Contoh perhitungan biaya

Angka nyata dengan tarif Gemini 2.5 Flash dari Kunavo, kecuali baris terakhir yang memakai Gemini 2.5 Pro:

Beban kerja	Token (masuk / keluar)	Model	Biaya
Putaran chatbot	1.000 / 300	Flash	$0.0003
Jawaban RAG	8.000 / 500	Flash	$0.0011
Klasifikasi batch (per dokumen)	500 / 20	Flash	$0.00006
Analisis konteks panjang	20.000 / 2.000	Pro	$0.0135

Dengan tarif itu, batch klasifikasi 100.000 dokumen di Flash menelan sekitar $6, dan satu juta putaran chatbot sekitar $315. Perhitungannya, siap dijalankan:

gemini_biaya.py

# Tarif Kunavo untuk Gemini 2.5 Flash (USD per 1J token)
IN_RATE, OUT_RATE = 0.09, 0.75

def biaya(token_masuk: int, token_keluar: int) -> float:
    return token_masuk / 1_000_000 * IN_RATE + token_keluar / 1_000_000 * OUT_RATE

print(biaya(1_000, 300))            # satu putaran chatbot      -> $0.000315
print(biaya(8_000, 500))            # satu jawaban RAG          -> $0.001095
print(biaya(500, 20) * 100_000)     # batch 100rb dokumen       -> ~$6.00

Harga Kunavo dan penagihan via Stripe

Tidak ada langganan dan tidak ada proyek Google Cloud. Anda menambahkan saldo ke dompet (Stripe atau metode pembayaran lokal), dan setiap panggilan memotong saldo itu dengan tarif per token di atas. Pay-as-you-go mulai dari top-up minimum $5, saldo tidak pernah hangus, dan top-up lebih besar mendapat kredit bonus. Satu dompet mencakup Gemini dan semua model lain — Claude, GPT, gambar, video, dan audio — sehingga Anda tidak perlu merekonsiliasi tagihan terpisah per penyedia.

Model Gemini mana yang harus saya pilih?

gemini-2-5-flash — default untuk chat, ekstraksi, klasifikasi, peringkasan, dan sebagian besar RAG. Cepat dan opsi mumpuni termurah.
gemini-2-5-pro — andalkan ketika Flash kurang akurat: penalaran multi-langkah, kode, visi, dan konteks sangat panjang.

Pola yang baik adalah merutekan berdasarkan tingkat kesulitan: Flash untuk kasus umum, naik ke Pro hanya ketika sebuah pemeriksaan gagal. Lihat panduan optimasi biaya AI untuk pola routing dalam kode.

Cara memangkas tagihan Gemini Anda

Turunkan tier. Kirim 80% yang mudah ke Flash; cadangkan Pro untuk 20% yang sulit.
Batasi keluaran. Setel max_tokens dan stop sequence — keluaran adalah sisi mahal dari meteran.
Rampingkan masukan. Ambil potongan RAG yang lebih sedikit tapi lebih baik, alih-alih menjejalkan seluruh basis pengetahuan ke konteks.
Batch. Gabungkan panggilan independen agar latensi tetap rendah dan menghindari badai retry.

FAQ

Apakah Gemini API gratis?

Google AI Studio punya tier gratis dengan batas laju untuk prototipe; produksi ditagih per token. Kunavo menerapkan pay-as-you-go mulai dari top-up minimum $5 — Anda membayar tarif per token di atas, saldo tidak pernah hangus, dan tidak perlu akun billing Google Cloud.

Berapa harga Gemini 2.5 Flash?

$0.09 per 1J token masukan dan $0.75 per 1J token keluaran di Kunavo — sekitar 70% di bawah harga list Google sebesar $0.30 / $2.50. Satu putaran chatbot biasa berbiaya sekitar $0.0003.

Apakah Gemini lebih murah dari Claude atau GPT?

Gemini 2.5 Flash adalah salah satu model mumpuni termurah yang ada — di bawah Claude Haiku dan sebagian besar tier GPT untuk beban kerja volume tinggi. Bandingkan tabel lengkapnya di halaman harga.

Bagaimana cara menekan biaya Gemini API?

Gunakan Flash, batasi keluaran, rampingkan konteks hasil pencarian, dan batch. Detailnya di panduan optimasi biaya. Untuk mulai memanggil Gemini, lihat cara mendapatkan Gemini API key.