모델 요금 문서 가이드 사용 사례 비교 소개

로그인 시작하기

신규 — Gemini 3, Claude Opus 4.7, Veo 3 모두 사용 가능

프런티어 모델,
공식 요금 30–70% 할인.

OpenAI, Anthropic, Google의 프런티어 모델 — Claude, Gemini, GPT-Image, Veo — 모두 공급사 공식 요금 대비 30–70% 저렴하게, 단일 OpenAI 호환 API로 통합되어 있습니다. base_url 한 줄만 바꾸면 바로 배포할 수 있습니다.

시작하기 문서 읽기

5초 설정 · 카드 불필요 · 최소 금액 없음

AI 에이전트에 붙여넣기

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

통합한 공급사

OpenAIAnthropicGoogle

30–70%

공식가 대비 절감

3,200+

활성 개발자

2.4억+

월 API 호출 수

99.95%

가동률 SLA

<120ms

P50 지연시간

200+

지원 모델 수

왜 Kunavo인가

출시하는 개발자를 위한 AI 게이트웨이.

라우팅 계층부터 과금 원장까지, Kunavo의 모든 부분은 실제 고객에게 AI 기능을 출시하는 인디 개발자와 소규모 팀을 위해 설계되었습니다.

글로벌 엣지 게이트웨이

다중 리전 Anycast 라우팅과 엣지에서의 TLS 종료. 북미, EU, APAC 어디서든 P50 120ms 이하.

OpenAI 호환

OpenAI SDK의 드롭인 대체. 스트리밍, 함수 호출, 도구 사용, 비전 — 모두 와이어 호환. 새로운 클라이언트를 배울 필요가 없습니다.

Stripe 네이티브 결제

카드, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — Stripe가 지원하는 모든 결제 수단을 지원합니다. 셀프 충전, 자동 충전, 인보이스 발행 가능.

프런티어 모델, 30–70% 할인

OpenAI, Anthropic, Google의 모든 모델이 공급사 공식 요금에서 30–70% 할인. Claude, Gemini, GPT-Image, Veo — 텍스트, 이미지, 비디오를 단일 청구서로.

투명한 가격

모든 모델의 100만 토큰당 가격이 공개되어 있습니다. 숨겨진 배수도, 깜짝 초과 요금도 없습니다. 실패한 요청에는 절대 과금하지 않습니다.

99.95% SLA

다중 공급사 페일오버가 50ms 이내에 완료됩니다. 한 업스트림이 흔들려도, 알아차리기 전에 요청이 다시 라우팅됩니다.

퍼스트 클래스 스트리밍

네이티브 SSE 패스스루. Time-to-first-token이 업스트림 공급사와 동일 — 버퍼링도, 배치 처리도, 지연도 없습니다.

세분화된 사용 데이터

모델, 키, IP별 콜 단위 분석. 사용 이벤트의 Webhook 전달. 필요하면 모든 것을 CSV로 내보낼 수 있습니다.

프롬프트 캐싱, 최대 90% 할인

Anthropic 캐시 읽기는 입력 요금의 10%로 과금 — 시스템 프롬프트에 cache_control을 전달하면 긴 컨텍스트가 거의 무료 재읽기가 됩니다. 적중률과 절감액은 대시보드에서 실시간으로 표시됩니다.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

모델 카탈로그

프런티어 모델, 공식 요금 30–70% 할인.

전체 카탈로그 보기

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

AI 에이전트용

에이전트를 `llms.txt`
에 연결하면 자율 작동.

Claude Code, Cursor, Cline — 또는 모든 OpenAI 호환 에이전트에 단 하나의 지시를 전달하세요. Kunavo에서 실시간 모델 카탈로그를 읽어 텍스트, 이미지, 비디오 모델을 스스로 구동합니다. SDK도, 글루 코드도 필요 없습니다.

OpenAI 와이어 호환 — 에이전트는 커스텀 통합 불필요
GET /v1/models은 실시간 카탈로그 — 모델 이름을 절대 하드코딩하지 마세요
모든 모달리티에 단일 키: 텍스트, 이미지, 비디오, 오디오

AI 에이전트에 붙여넣기

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

충전하고 절약하세요

선결제할수록 더 많이 절약합니다.

선불 지갑. $10부터 시작. 구독 불필요, 최소 금액 없음, 잔액은 만료되지 않습니다.

Starter

둘러보는 중

$10

모든 모델 액세스
콜 단위 사용 분석
커뮤니티 & 이메일 지원
최소 금액 없음, 카드 불필요

Most popular

Builder

한정 · +$10

제품 출시 중

$100

$100 입금 = $110 크레딧
독립된 API 키 10개
자동 충전 · IP 허용 목록
우선 이메일 지원

Scale

한정 · +$250

프로덕션 트래픽 운영 중

$1000

$1000 입금 = $1250 크레딧
무제한 API 키
Webhook · 월간 인보이스
전담 Slack/Discord 지원

Enterprise

한정 · +$2000

고용량 규모

$5000

$5000 입금 = $7000 크레딧
Scale의 모든 기능
맞춤형 속도 제한 & SLA
전담 어카운트 매니저

전체 요금표 보기

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

여러분이 궁금해하는
모든 것.

질문에 대한 답을 찾지 못하셨나요? contact@kunavo.com으로 이메일을 보내주세요 — 24시간 이내에 답변드립니다.

Kunavo는 프로덕션 AI 기능을 출시하는 인디 개발자와 소규모 팀을 위해 설계되었습니다. 세 가지 진짜 차이점: (1) 텍스트, 이미지, 비디오를 단일 청구서로 커버 — 많은 애그리게이터는 텍스트만 다룸; (2) Stripe 네이티브 체크아웃, ACH, SEPA, Apple Pay, WeChat Pay 모두 포함 — 플랫폼 외 인보이스 없음; (3) 라우팅의 완전한 투명성 — 모델을 더 저렴한 것으로 몰래 바꾸지 않습니다.
모든 모델이 공급사 공식 정가에서 약 30–70% 할인 — 더 큰 충전에는 추가 보너스가 더해집니다. 운영 면에서도 절약됩니다: 단일 계약, 단일 인보이스, 단일 SDK, 약정 최소 금액 없음. 각 모델의 100만 토큰당 요금은 /pricing에 게시 — 언제든지 업스트림 가격과 쉽게 비교할 수 있습니다.
예. OpenAI의 전체 엔드포인트 세트를 구현했습니다: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models, /v1/video/generations. 스트리밍, 함수 호출, 비전, 도구 사용 모두 동일하게 동작합니다. OpenAI SDK를 사용하는 프로젝트는 base_url만 바꾸면 — 그게 전부입니다.
없습니다. Kunavo는 선불 지갑입니다. 충전은 계정에 영구적으로 남습니다 — 구독, 월 최소 금액, 만료 없음. 계정 폐쇄 시 원래 결제 수단으로 잔액을 환불해드립니다.
절대 아닙니다. 4xx와 5xx 응답은 과금되지 않습니다. 중간에 끊긴 스트리밍 응답은 실제로 전달된 토큰에 대해서만 과금됩니다. 모든 과금은 사용 대시보드에서 콜 단위로 확인할 수 있으며, 회계용으로 CSV 내보내기가 가능합니다.
Stripe가 지원하는 모든 것: 카드 (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay 외. 자동 충전은 옵트인. 엔터프라이즈 고객은 Net 30 조건으로 인보이스 결제 가능.
엣지 게이트웨이 노드는 북미, 유럽, 아시아 태평양에 배포되어 있습니다. 무상태 라우팅 로직이 엣지에서 실행되어 P50 지연시간이 120ms 미만입니다. 과금 데이터, 계정, 감사 로그는 주 리전에 저장되며 다중 리전 복제됩니다.

3분이면 첫 호출까지.

Claude, Gemini, GPT-Image 등 200+ 모델을 위한 OpenAI 호환 API 하나 — 최소 $5 충전, 호출한 만큼만 결제.

시작하기 퀵스타트 읽기