Mô hình Bảng giá Tài liệu Hướng dẫn Trường hợp sử dụng So sánh Giới thiệu

Đăng nhập Bắt đầu

Mới — Gemini 3, Claude Opus 4.7, Veo 3 đã có mặt

Mô hình tiên phong,
rẻ hơn 30–70% so với giá chính thức.

Các mô hình tiên phong từ OpenAI, Anthropic và Google — Claude, Gemini, GPT-Image, Veo — tất cả đều giảm 30–70% so với giá chính thức, sau một API tương thích với OpenAI. Đổi một dòng base_url và bạn đã lên production.

Bắt đầu Đọc tài liệu

Thiết lập trong 5 giây · Không cần thẻ · Không yêu cầu tối thiểu

Dán vào AI agent của bạn

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Nhà cung cấp đã tích hợp

OpenAIAnthropicGoogle

30–70%

Dưới giá chính thức

3.200+

Lập trình viên đang hoạt động

240 tr+

Lượt gọi API mỗi tháng

99,95%

SLA khả dụng

<120 ms

Độ trễ P50

200+

Mô hình có sẵn

Vì sao chọn Kunavo

Gateway AI cho lập trình viên đưa sản phẩm lên production.

Từ lớp routing đến sổ cái thanh toán, mỗi lớp của Kunavo đều được thiết kế cho lập trình viên độc lập và đội nhỏ đang mang tính năng AI đến người dùng thật.

Edge gateway toàn cầu

Routing Anycast đa vùng với kết thúc TLS tại edge. P50 dưới 120 ms từ Bắc Mỹ, EU hay APAC.

Tương thích với OpenAI

Thay thế drop-in cho SDK OpenAI. Streaming, function calling, tool use, vision — tất cả tương thích ở cấp giao thức. Không cần học client mới.

Thanh toán native Stripe

Thẻ, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — mọi phương thức của Stripe. Nạp tiền tự phục vụ, tự động nạp, lập hóa đơn tự động.

Mô hình tiên phong, rẻ hơn 30–70%

Mọi mô hình từ OpenAI, Anthropic và Google với giá chính thức trừ 30–70%. Claude, Gemini, GPT-Image, Veo — văn bản, hình ảnh và video trong một hóa đơn.

Giá minh bạch

Mức giá trên mỗi triệu token được công bố cho từng mô hình. Không có hệ số nhân ẩn, không bất ngờ, request thất bại không bị tính phí.

SLA 99,95%

Failover đa nhà cung cấp trong dưới 50 ms. Khi một upstream chệch choạc, request của bạn được định tuyến lại trước khi bạn kịp nhận ra.

Streaming hạng nhất

Triển khai SSE passthrough native. Time-to-first-token giống hệt upstream — không buffering, không batching, không thêm độ trễ.

Mức dùng chi tiết

Analytics theo từng lượt gọi cho mỗi mô hình, mỗi key, mỗi IP. Webhook cho sự kiện sử dụng. Xuất tất cả ra CSV bất cứ khi nào bạn muốn.

Prompt caching, rẻ tới 90%

Đọc cache của Anthropic được tính 10% giá input — truyền cache_control trong system prompt của bạn và những ngữ cảnh dài trở thành các lần đọc lại gần như miễn phí. Hit rate và mức tiết kiệm theo thời gian thực trên dashboard.

−90%

Use cases

What to build with Kunavo.

Browse all use cases

Danh mục mô hình

Mô hình tiên phong, dưới giá chính thức 30–70%.

Xem toàn bộ danh mục

Claude Fable 5

Anthropic's most capable model — frontier reasoning, long-horizon agents, 1M context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 5

Near-flagship Opus reasoning at half the price of Fable 5 — vision, agentic coding, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 5 Fast

Opus 5 tuned for latency — same frontier reasoning, faster output, 200K context.

visionfunctionstreamingthinking

$10 / $50per 1M tokens

Claude Opus 4.7

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$5 / $25per 1M tokens

Claude Sonnet 5

Near-Opus coding and agentic quality at Sonnet cost — 1M context.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Sonnet 4.6

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$3 / $15per 1M tokens

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$1 / $5per 1M tokens

Gemini 3.6 Flash

Google's newest Flash — thinking-by-default at Flash latency, 1M context, native audio input.

visionfunctionstreamingthinking

$1.5 / $7.5per 1M tokens

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.25 / $10per 1M tokens

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.3 / $2.5per 1M tokens

GPT-5.6 Sol

OpenAI's newest flagship — top-tier reasoning and agentic coding, 1.05M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context

$2.5 / $15per 1M tokens

GPT-5.5

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context

$5 / $30per 1M tokens

GPT-5.4 Mini

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking

$0.75 / $4.5per 1M tokens

GPT-5.3 Codex

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context

$1.75 / $14per 1M tokens

GPT-5.5 Pro

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context

$30 / $180per 1M tokens

Dành cho AI agent

Trỏ agent của bạn tới `llms.txt`
và nó tự chạy.

Hãy đưa cho Claude Code, Cursor, Cline — hay bất kỳ agent nào tương thích OpenAI — một chỉ dẫn duy nhất. Nó sẽ tải danh mục mô hình trực tiếp của Kunavo và vận hành các mô hình văn bản, hình ảnh, video một cách tự chủ. Không SDK, không glue code.

Tương thích với giao thức OpenAI — agent không cần tích hợp tùy chỉnh
GET /v1/models là danh mục trực tiếp — đừng bao giờ hardcode tên mô hình
Một key, mọi phương thức: văn bản, hình ảnh, video, âm thanh

Dán vào AI agent của bạn

Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Nạp tiền và tiết kiệm

Nạp trước càng nhiều, tiết kiệm càng lớn.

Ví trả trước. Từ $10. Không đăng ký định kỳ, không yêu cầu tối thiểu, số dư không hết hạn.

Starter

Thử nghiệm đầu tiên

$10

Truy cập tất cả mô hình
Analytics theo từng lượt gọi
Hỗ trợ cộng đồng và email
Không tối thiểu, không cần thẻ

Đăng ký miễn phí

Most popular

Builder

Giới hạn · +$10

Bạn đang xây dựng một sản phẩm

$100

$110 tín dụng cho mỗi $100 nạp vào
10 API key độc lập
Tự động nạp · Danh sách IP được phép
Hỗ trợ email ưu tiên

Scale

Giới hạn · +$250

Lưu lượng production

$1000

$1.250 tín dụng cho mỗi $1.000 nạp vào
API key không giới hạn
Webhook · Hóa đơn hàng tháng
Hỗ trợ riêng qua Slack/Discord

Enterprise

Giới hạn · +$2000

Quy mô lớn

$5000

$7.000 tín dụng cho mỗi $5.000 nạp vào
Toàn bộ Scale + nhiều hơn
Rate limit và SLA tùy chỉnh
Account manager riêng

Xem bảng giá đầy đủ

Guides

Start with the popular guides.

Browse all guides

From the blog

Recent deep dives.

FAQ

Mọi điều
bạn đang băn khoăn.

Không tìm thấy câu trả lời? Viết cho chúng tôi tại contact@kunavo.com — chúng tôi phản hồi trong 24 giờ.

Kunavo được thiết kế riêng cho lập trình viên indie và đội nhỏ đưa tính năng AI lên production. Ba khác biệt thực sự: (1) chúng tôi bao phủ văn bản, hình ảnh và video trong một hóa đơn — nhiều bộ tổng hợp chỉ có văn bản; (2) checkout native Stripe, ACH, SEPA, Apple Pay, WeChat Pay đều có sẵn — không hóa đơn ngoài nền tảng; (3) minh bạch hoàn toàn trong routing — chúng tôi không bao giờ âm thầm đổi mô hình của bạn sang loại rẻ hơn.
Mỗi mô hình thấp hơn khoảng 30–70% so với giá chính thức của nhà cung cấp — và các lần nạp lớn còn cộng thêm tiền thưởng. Bạn cũng tiết kiệm về vận hành: một hợp đồng, một hóa đơn, một SDK, không cam kết tối thiểu. Giá trên mỗi triệu token của từng mô hình được công bố tại /pricing — có thể so sánh với bảng niêm yết upstream bất cứ lúc nào.
Có. Chúng tôi triển khai trọn bộ endpoint của OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models và /v1/video/generations. Streaming, function calling, vision và tool use hoạt động y hệt. Các dự án dùng SDK OpenAI chuyển đổi chỉ bằng cách thay base_url — chỉ vậy thôi.
Không. Kunavo là một ví trả trước. Số tiền nạp ở lại trong tài khoản của bạn mãi mãi — không đăng ký định kỳ, không tối thiểu hàng tháng, không hết hạn. Đóng tài khoản sẽ hoàn số dư còn lại về phương thức thanh toán ban đầu.
Không bao giờ. Phản hồi 4xx và 5xx không bị tính phí. Phản hồi streaming bị ngắt giữa chừng chỉ bị tính phí cho những token đã thực sự được gửi đi. Mọi khoản phí đều hiển thị theo từng lượt gọi trên dashboard mức dùng, có thể xuất ra CSV để hạch toán.
Mọi thứ Stripe hỗ trợ: thẻ (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay và nhiều hơn nữa. Tự động nạp là tùy chọn bật. Khách hàng Enterprise có thể thanh toán qua hóa đơn với điều khoản Net 30.
Các node edge được triển khai ở Bắc Mỹ, châu Âu và châu Á - Thái Bình Dương. Logic routing stateless chạy tại edge để đạt độ trễ P50 dưới 120 ms. Dữ liệu thanh toán, tài khoản và log kiểm toán được lưu ở một vùng chính với sao chép đa vùng.

Ba phút đến lượt gọi đầu tiên của bạn.

Một API tương thích OpenAI duy nhất cho Claude, Gemini, GPT-Image và hơn 200 mô hình khác — nạp tối thiểu $5, bạn chỉ trả cho những gì bạn gọi.

Bắt đầu Đọc quickstart