Back to guides
가격·June 18, 2026·8 min read

Gemini API 가격 2026 — 제미나이 API 요금 완전 정리

Gemini는 프런티어 AI 중 가성비 최고 수준이고, Kunavo는 이를 Google 정가보다 약 60% 저렴하게 제공합니다. 모델별 현재 요율과 직접 검증할 수 있는 비용 예시, 프로덕션에서 가장 저렴하게 호출하는 방법을 한곳에 정리했습니다.

Gemini는 프런티어 AI 중에서도 가성비가 가장 뛰어난 축에 속하며, Kunavo는 하나의 OpenAI 호환 API 뒤에서 이를 Google 정가보다 약 70% 저렴하게 제공합니다. 이 가이드는 현재 모델별 요율, 직접 검증할 수 있는 비용 계산 예시, 그리고 프로덕션에서 Gemini를 가장 저렴하게 호출하는 방법을 알려드립니다.

한눈에 보는 Gemini 가격

요율은 Kunavo에서 청구되는 기준으로 1M 토큰당 USD입니다. “Google 정가” 열은 동일 모델에 대한 Google의 공시 요율로, 차이를 한눈에 볼 수 있도록 함께 표시했습니다.

모델입력 / 1M출력 / 1MGoogle 정가 (입력 / 출력)절감률
gemini-2-5-flash$0.09$0.75$0.30 / $2.50~70%
gemini-2-5-pro$0.375$3.00$1.25 / $10.00~70%

Flash는 대량 처리용 주력 모델이고, Pro는 더 어려운 추론, 비전, 긴 컨텍스트 작업에 적합합니다. 실시간 요율은 항상 가격 페이지와 각 모델 페이지에서 확인할 수 있습니다 (gemini-2-5-flash, gemini-2-5-pro).

Gemini 토큰 가격은 어떻게 작동하나요

입력 토큰(보내는 모든 것 — 시스템 프롬프트, 검색된 컨텍스트, 사용자 메시지)과 출력 토큰(모델이 생성하는 내용)에 대해 비용을 지불합니다. 출력 쪽이 더 비싸므로, Gemini 청구액을 좌우하는 가장 큰 레버는 모델이 글을 얼마나 쓰게 두느냐입니다. 이미지와 오디오는 토큰 환산값으로 변환되어 같은 계량기에서 청구됩니다.

비용 계산 예시

Kunavo의 Gemini 2.5 Flash 요율로 계산한 실제 수치이며, 마지막 행만 Gemini 2.5 Pro를 사용합니다:

작업토큰 (입력 / 출력)모델비용
챗봇 한 턴1,000 / 300Flash$0.0003
RAG 답변8,000 / 500Flash$0.0011
배치 분류 (문서당)500 / 20Flash$0.00006
긴 컨텍스트 분석20,000 / 2,000Pro$0.0135

이 요율이면 Flash로 문서 10만 건을 분류하는 배치가 약 $6, 챗봇 100만 턴이 약 $315입니다. 직접 실행할 수 있는 계산식:

gemini_cost.py
# Kunavo Gemini 2.5 Flash 요율 (1M 토큰당 USD)
IN_RATE, OUT_RATE = 0.09, 0.75

def cost(in_tokens: int, out_tokens: int) -> float:
    return in_tokens / 1_000_000 * IN_RATE + out_tokens / 1_000_000 * OUT_RATE

print(cost(1_000, 300))            # 챗봇 한 턴        -> $0.000315
print(cost(8_000, 500))            # RAG 답변 한 건    -> $0.001095
print(cost(500, 20) * 100_000)     # 10만 건 배치      -> ~$6.00

Kunavo 가격과 Stripe 결제

구독도, Google Cloud 프로젝트도 없습니다. 잔액을 충전하면(Stripe 또는 현지 결제 수단) 호출 시 위 토큰당 요율로 잔액에서 차감됩니다. 최소 $5 충전부터 사용한 만큼 지불하고, 잔액은 만료되지 않으며, 충전 금액이 클수록 보너스 크레딧이 붙습니다. 하나의 잔액으로 Gemini는 물론 Claude, GPT, 이미지, 비디오, 오디오 등 모든 모델을 사용하므로, 제공자별로 별도 청구서를 대조할 필요가 없습니다.

어떤 Gemini 모델을 선택해야 하나요?

  • gemini-2-5-flash — 채팅, 추출, 분류, 요약, 대부분의 RAG에 기본으로 사용하세요. 빠르고 가장 저렴한 고성능 옵션입니다.
  • gemini-2-5-pro — Flash로 정확도가 부족할 때 선택하세요: 다단계 추론, 코드, 비전, 매우 긴 컨텍스트.

좋은 패턴은 난이도에 따라 라우팅하는 것입니다: 일반적인 경우는 Flash로 처리하고, 검증에 실패할 때만 Pro로 승격하세요. 코드로 구현한 라우팅 패턴은 AI 비용 최적화 가이드를 참고하세요.

Gemini 청구액 줄이기

  1. 등급을 낮추세요. 쉬운 80%는 Flash로 보내고, Pro는 어려운 20%를 위해 아껴두세요.
  2. 출력을 제한하세요. max_tokens와 중단 시퀀스를 설정하세요 — 출력이 계량기의 비싼 쪽입니다.
  3. 입력을 줄이세요. 지식 베이스 전체를 컨텍스트에 욱여넣지 말고, 더 적고 더 좋은 RAG 청크를 검색하세요.
  4. 배치 처리하세요. 독립적인 호출을 묶어 지연을 낮추고 재시도 폭주를 피하세요.

자주 묻는 질문

Gemini API는 무료인가요?

Google AI Studio는 프로토타이핑용 무료 등급(요청 제한)을 제공하며, 프로덕션은 토큰당 과금입니다. Kunavo는 최소 $5 충전부터 사용한 만큼 지불하는 방식으로, 위 토큰당 요율대로 결제하며 잔액은 만료되지 않고 Google Cloud 결제 계정도 필요 없습니다.

Gemini 2.5 Flash 비용은 얼마인가요?

Kunavo에서 입력 1M 토큰당 $0.09, 출력 1M 토큰당 $0.75으로, Google 정가 $0.30 / $2.50보다 약 70% 저렴합니다. 일반적인 챗봇 한 턴은 약 $0.0003입니다.

Gemini는 Claude나 GPT보다 저렴한가요?

Gemini 2.5 Flash는 어디에서도 가장 저렴한 고성능 모델 중 하나로, 대량 작업에서 Claude Haiku와 대부분의 GPT 등급보다 낮습니다. 전체 표는 가격 페이지에서 비교하세요.

Gemini API 비용을 어떻게 줄이나요?

Flash로 등급을 낮추고, 출력을 제한하고, 검색 컨텍스트를 줄이고, 배치 처리하세요. 자세한 내용은 비용 최적화 가이드에 있습니다. Gemini 호출을 시작하려면 Gemini API 키 발급 방법을 참고하세요.