프런티어 모델,
공식 요금 30% 할인.
OpenAI, Anthropic, Google의 프런티어 모델 — Claude, Gemini, GPT-Image, Veo — 모두 공급사 공식 요금 대비 30% 저렴하게, 단일 OpenAI 호환 API로 통합되어 있습니다. base_url 한 줄만 바꾸면 바로 배포할 수 있습니다.
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
통합한 공급사
출시하는 개발자를 위한 AI 게이트웨이.
라우팅 계층부터 과금 원장까지, Kunavo의 모든 부분은 실제 고객에게 AI 기능을 출시하는 인디 개발자와 소규모 팀을 위해 설계되었습니다.
글로벌 엣지 게이트웨이
다중 리전 Anycast 라우팅과 엣지에서의 TLS 종료. 북미, EU, APAC 어디서든 P50 120ms 이하.
OpenAI 호환
OpenAI SDK의 드롭인 대체. 스트리밍, 함수 호출, 도구 사용, 비전 — 모두 와이어 호환. 새로운 클라이언트를 배울 필요가 없습니다.
Stripe 네이티브 결제
카드, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — Stripe가 지원하는 모든 결제 수단을 지원합니다. 셀프 충전, 자동 충전, 인보이스 발행 가능.
프런티어 모델, 30% 할인
OpenAI, Anthropic, Google의 모든 모델이 공급사 공식 요금에서 30% 할인. Claude, Gemini, GPT-Image, Veo — 텍스트, 이미지, 비디오를 단일 청구서로.
투명한 가격
모든 모델의 100만 토큰당 가격이 공개되어 있습니다. 숨겨진 배수도, 깜짝 초과 요금도 없습니다. 실패한 요청에는 절대 과금하지 않습니다.
99.95% SLA
다중 공급사 페일오버가 50ms 이내에 완료됩니다. 한 업스트림이 흔들려도, 알아차리기 전에 요청이 다시 라우팅됩니다.
퍼스트 클래스 스트리밍
네이티브 SSE 패스스루. Time-to-first-token이 업스트림 공급사와 동일 — 버퍼링도, 배치 처리도, 지연도 없습니다.
세분화된 사용 데이터
모델, 키, IP별 콜 단위 분석. 사용 이벤트의 Webhook 전달. 필요하면 모든 것을 CSV로 내보낼 수 있습니다.
프롬프트 캐싱, 최대 90% 할인
Anthropic 캐시 읽기는 입력 요금의 10%로 과금 — 시스템 프롬프트에 cache_control을 전달하면 긴 컨텍스트가 거의 무료 재읽기가 됩니다. 적중률과 절감액은 대시보드에서 실시간으로 표시됩니다.
What to build with Kunavo.
- Customer Support
AI customer support
The fastest-ROI AI deployment in any B2C SaaS — automate ticket triage, draft 80% of responses, and escalate the rest cleanly. Production code, real cost numbers, and the compliance pitfalls that catch teams off-guard.
Explore - Knowledge Base
RAG chatbot API
Most internal knowledge bases are dead documentation — nobody finds anything. A Claude-backed RAG chatbot turns them into a real assistant that cites sources and refuses when it doesn't know. Here's the production pattern.
Explore - Trust & Safety
AI content moderation
Modern moderation isn't just regex — it's nuance: sarcasm, dog whistles, brand-context misuse, image+text combinations. LLMs do this far better than rule-based systems, at a price that scales.
Explore - Developer Tools
AI code assistant
Cursor, Aider, Cline, Continue.dev — they're all powered by the same handful of frontier LLMs. If you're building a coding tool (or a co-pilot inside your own dev product), here's the architecture and the cost reality.
Explore - Data Processing
AI data extraction
The boring, valuable use case. Invoices, receipts, contracts, leads, resumes — anywhere you'd previously have built a parser, an LLM with JSON-mode does it in 30 lines, more accurately, and you can ship in a day instead of a quarter.
Explore
프런티어 모델, 공식 요금 30% 할인.
Claude Opus 4.7
Anthropic's newest Opus — flagship reasoning, vision, 200K context.
Claude Opus 4.6
Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.
Claude Sonnet 4.6
Balanced speed/quality — the everyday production workhorse, elite coding.
Claude Sonnet 4.5
Anthropic Sonnet 4.5 — production workhorse.
Claude Haiku 4.5
Anthropic Haiku 4.5 — fast and cost-efficient.
Gemini 3 Pro
Google's flagship — native multimodal, 1M+ context, chain-of-thought.
Gemini 3.1 Pro
Latest Gemini 3.1 Pro — incremental quality bump.
Gemini 3 Flash
Cost-efficient Gemini — millisecond responses for high-frequency calls.
Gemini 2.5 Pro
Previous-gen Gemini Pro — strong reasoning and vision.
Gemini 2.5 Flash
Previous-gen Gemini Flash — extreme value.
에이전트를 llms.txt
에 연결하면 자율 작동.
Claude Code, Cursor, Cline — 또는 모든 OpenAI 호환 에이전트에 단 하나의 지시를 전달하세요. Kunavo에서 실시간 모델 카탈로그를 읽어 텍스트, 이미지, 비디오 모델을 스스로 구동합니다. SDK도, 글루 코드도 필요 없습니다.
- OpenAI 와이어 호환 — 에이전트는 커스텀 통합 불필요
- GET /v1/models은 실시간 카탈로그 — 모델 이름을 절대 하드코딩하지 마세요
- 모든 모달리티에 단일 키: 텍스트, 이미지, 비디오, 오디오
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model. base_url: https://api.kunavo.com/v1 auth: Authorization: Bearer $KUNAVO_API_KEY To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Recent deep dives.
- 实战·5 min
在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测
实测从北京/上海/深圳调用 Kunavo 的延迟和成功率:无需代理,P50 80-150ms,成功率 99.9%+。支付宝/微信支付/双币卡都可用。健壮重试代码 + 何时真的需要代理。
- 教學·6 min
用 Veo 3 與 Sora 為台灣品牌做短影片廣告 — 5 分鐘完整教學
從文字 prompt 到 9:16 直式 Reels / TikTok / IG 短影片,全流程教學。圖生影片用既有產品照片動起來。5 種台灣品牌實際應用、繁中文字渲染注意事項、商業可用品質的進階技巧。
- 実装ガイド·8 min
日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で
社内ドキュメント 5,000 件を Claude Sonnet 4.6 で検索可能にする RAG 完全実装。埋め込みコスト $0.25、1 クエリ約 0.9 円(prompt caching 適用後)。日本語特有のトークン消費・ハルシネーション対策・本番投入チェックリスト含む。
Kunavo는 프로덕션 AI 기능을 출시하는 인디 개발자와 소규모 팀을 위해 설계되었습니다. 세 가지 진짜 차이점: (1) 텍스트, 이미지, 비디오를 단일 청구서로 커버 — 많은 애그리게이터는 텍스트만 다룸; (2) Stripe 네이티브 체크아웃, ACH, SEPA, Apple Pay, WeChat Pay 모두 포함 — 플랫폼 외 인보이스 없음; (3) 라우팅의 완전한 투명성 — 모델을 더 저렴한 것으로 몰래 바꾸지 않습니다.
모든 모델이 공급사 공식 정가에서 약 30% 할인 — 더 큰 충전에는 추가 보너스가 더해집니다. 운영 면에서도 절약됩니다: 단일 계약, 단일 인보이스, 단일 SDK, $2 시작 크레딧, 약정 최소 금액 없음. 각 모델의 100만 토큰당 요금은 /pricing에 게시 — 언제든지 업스트림 가격과 쉽게 비교할 수 있습니다.
예. OpenAI의 전체 엔드포인트 세트를 구현했습니다: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models, /v1/video/generations. 스트리밍, 함수 호출, 비전, 도구 사용 모두 동일하게 동작합니다. OpenAI SDK를 사용하는 프로젝트는 base_url만 바꾸면 — 그게 전부입니다.
없습니다. Kunavo는 선불 지갑입니다. 충전은 계정에 영구적으로 남습니다 — 구독, 월 최소 금액, 만료 없음. 계정 폐쇄 시 원래 결제 수단으로 잔액을 환불해드립니다.
절대 아닙니다. 4xx와 5xx 응답은 과금되지 않습니다. 중간에 끊긴 스트리밍 응답은 실제로 전달된 토큰에 대해서만 과금됩니다. 모든 과금은 사용 대시보드에서 콜 단위로 확인할 수 있으며, 회계용으로 CSV 내보내기가 가능합니다.
Stripe가 지원하는 모든 것: 카드 (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay 외. 자동 충전은 옵트인. 엔터프라이즈 고객은 Net 30 조건으로 인보이스 결제 가능.
엣지 게이트웨이 노드는 북미, 유럽, 아시아 태평양에 배포되어 있습니다. 무상태 라우팅 로직이 엣지에서 실행되어 P50 지연시간이 120ms 미만입니다. 과금 데이터, 계정, 감사 로그는 주 리전에 저장되며 다중 리전 복제됩니다.