Mới — Gemini 3, Claude Opus 4.7, Veo 3 đã có mặt

Mô hình tiên phong,
rẻ hơn 30–70% so với giá chính thức.

Các mô hình tiên phong từ OpenAI, Anthropic và Google — Claude, Gemini, GPT-Image, Veo — tất cả đều giảm 30–70% so với giá chính thức, sau một API tương thích với OpenAI. Đổi một dòng base_url và bạn đã lên production.

Thiết lập trong 5 giây · Không cần thẻ · Không yêu cầu tối thiểu
Dán vào AI agent của bạn
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt

Nhà cung cấp đã tích hợp

OpenAIAnthropicGoogle
30–70%
Dưới giá chính thức
3.200+
Lập trình viên đang hoạt động
240 tr+
Lượt gọi API mỗi tháng
99,95%
SLA khả dụng
<120 ms
Độ trễ P50
200+
Mô hình có sẵn
Vì sao chọn Kunavo

Gateway AI cho lập trình viên đưa sản phẩm lên production.

Từ lớp routing đến sổ cái thanh toán, mỗi lớp của Kunavo đều được thiết kế cho lập trình viên độc lập và đội nhỏ đang mang tính năng AI đến người dùng thật.

Edge gateway toàn cầu

Routing Anycast đa vùng với kết thúc TLS tại edge. P50 dưới 120 ms từ Bắc Mỹ, EU hay APAC.

Tương thích với OpenAI

Thay thế drop-in cho SDK OpenAI. Streaming, function calling, tool use, vision — tất cả tương thích ở cấp giao thức. Không cần học client mới.

Thanh toán native Stripe

Thẻ, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — mọi phương thức của Stripe. Nạp tiền tự phục vụ, tự động nạp, lập hóa đơn tự động.

Mô hình tiên phong, rẻ hơn 30–70%

Mọi mô hình từ OpenAI, Anthropic và Google với giá chính thức trừ 30–70%. Claude, Gemini, GPT-Image, Veo — văn bản, hình ảnh và video trong một hóa đơn.

Giá minh bạch

Mức giá trên mỗi triệu token được công bố cho từng mô hình. Không có hệ số nhân ẩn, không bất ngờ, request thất bại không bị tính phí.

SLA 99,95%

Failover đa nhà cung cấp trong dưới 50 ms. Khi một upstream chệch choạc, request của bạn được định tuyến lại trước khi bạn kịp nhận ra.

Streaming hạng nhất

Triển khai SSE passthrough native. Time-to-first-token giống hệt upstream — không buffering, không batching, không thêm độ trễ.

Mức dùng chi tiết

Analytics theo từng lượt gọi cho mỗi mô hình, mỗi key, mỗi IP. Webhook cho sự kiện sử dụng. Xuất tất cả ra CSV bất cứ khi nào bạn muốn.

Prompt caching, rẻ tới 90%

Đọc cache của Anthropic được tính 10% giá input — truyền cache_control trong system prompt của bạn và những ngữ cảnh dài trở thành các lần đọc lại gần như miễn phí. Hit rate và mức tiết kiệm theo thời gian thực trên dashboard.

Danh mục mô hình

Mô hình tiên phong, dưới giá chính thức 30–70%.

Xem toàn bộ danh mục
Anthropic

Claude Opus 4.7

60%+ OFFnew

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking
$2.00/$10.00
$5 / $25per 1M tokens
Anthropic

Claude Opus 4.6

60%+ OFF

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking
$2.00/$10.00
$5 / $25per 1M tokens
Anthropic

Claude Sonnet 4.6

60%+ OFFhot

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking
$1.20/$6.00
$3 / $15per 1M tokens
Anthropic

Claude Haiku 4.5

60%+ OFF

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming
$0.40/$2.00
$1 / $5per 1M tokens
Google

Gemini 2.5 Pro

70%+ OFF

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking
$0.375/$3.00
$1.25 / $10per 1M tokens
Google

Gemini 2.5 Flash

70%+ OFF

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming
$0.09/$0.75
$0.3 / $2.5per 1M tokens
OpenAI

GPT-5.4

60%+ OFFnew

OpenAI GPT-5.4 — strong general reasoning, 1M context.

functionstreamingthinkinglong-context
$1.00/$6.00
$2.5 / $15per 1M tokens
OpenAI

GPT-5.5

60%+ OFFnew

OpenAI GPT-5.5 — flagship reasoning, 1M context.

functionstreamingthinkinglong-context
$2.00/$12.00
$5 / $30per 1M tokens
OpenAI

GPT-5.4 Mini

70%+ OFF

OpenAI GPT-5.4 Mini — fast, cost-efficient reasoning.

functionstreamingthinking
$0.225/$1.35
$0.75 / $4.5per 1M tokens
OpenAI

GPT-5.3 Codex

60%+ OFF

OpenAI GPT-5.3 Codex — coding-specialized.

functionstreamingthinkinglong-context
$0.70/$5.60
$1.75 / $14per 1M tokens
OpenAI

GPT-5.5 Pro

60%+ OFFnew

OpenAI GPT-5.5 Pro — deep-horizon enterprise reasoning, 1.1M context.

functionstreamingthinkinglong-context
$12.00/$72.00
$30 / $180per 1M tokens
Dành cho AI agent

Trỏ agent của bạn tới llms.txt
và nó tự chạy.

Hãy đưa cho Claude Code, Cursor, Cline — hay bất kỳ agent nào tương thích OpenAI — một chỉ dẫn duy nhất. Nó sẽ tải danh mục mô hình trực tiếp của Kunavo và vận hành các mô hình văn bản, hình ảnh, video một cách tự chủ. Không SDK, không glue code.

  • Tương thích với giao thức OpenAI — agent không cần tích hợp tùy chỉnh
  • GET /v1/models là danh mục trực tiếp — đừng bao giờ hardcode tên mô hình
  • Một key, mọi phương thức: văn bản, hình ảnh, video, âm thanh
Dán vào AI agent của bạn
Use Kunavo as your model provider — an OpenAI-compatible gateway to every frontier text, image and video model.

base_url:  https://api.kunavo.com/v1
auth:      Authorization: Bearer $KUNAVO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its kunavo.endpoint field. Full agent reference: https://kunavo.com/llms.txt
Nạp tiền và tiết kiệm

Nạp trước càng nhiều, tiết kiệm càng lớn.

Ví trả trước. Từ $10. Không đăng ký định kỳ, không yêu cầu tối thiểu, số dư không hết hạn.

Starter

Thử nghiệm đầu tiên

$10
  • Truy cập tất cả mô hình
  • Analytics theo từng lượt gọi
  • Hỗ trợ cộng đồng và email
  • Không tối thiểu, không cần thẻ
Đăng ký miễn phí
Most popular

Builder

Giới hạn · +$10

Bạn đang xây dựng một sản phẩm

$100
  • $110 tín dụng cho mỗi $100 nạp vào
  • 10 API key độc lập
  • Tự động nạp · Danh sách IP được phép
  • Hỗ trợ email ưu tiên
Nạp $100

Scale

Giới hạn · +$250

Lưu lượng production

$1000
  • $1.250 tín dụng cho mỗi $1.000 nạp vào
  • API key không giới hạn
  • Webhook · Hóa đơn hàng tháng
  • Hỗ trợ riêng qua Slack/Discord
Nạp $1000

Enterprise

Giới hạn · +$2000

Quy mô lớn

$5000
  • $7.000 tín dụng cho mỗi $5.000 nạp vào
  • Toàn bộ Scale + nhiều hơn
  • Rate limit và SLA tùy chỉnh
  • Account manager riêng
Nạp $5000
FAQ

Mọi điều
bạn đang băn khoăn.

Không tìm thấy câu trả lời? Viết cho chúng tôi tại contact@kunavo.com — chúng tôi phản hồi trong 24 giờ.

  • Kunavo được thiết kế riêng cho lập trình viên indie và đội nhỏ đưa tính năng AI lên production. Ba khác biệt thực sự: (1) chúng tôi bao phủ văn bản, hình ảnh và video trong một hóa đơn — nhiều bộ tổng hợp chỉ có văn bản; (2) checkout native Stripe, ACH, SEPA, Apple Pay, WeChat Pay đều có sẵn — không hóa đơn ngoài nền tảng; (3) minh bạch hoàn toàn trong routing — chúng tôi không bao giờ âm thầm đổi mô hình của bạn sang loại rẻ hơn.

  • Mỗi mô hình thấp hơn khoảng 30–70% so với giá chính thức của nhà cung cấp — và các lần nạp lớn còn cộng thêm tiền thưởng. Bạn cũng tiết kiệm về vận hành: một hợp đồng, một hóa đơn, một SDK, không cam kết tối thiểu. Giá trên mỗi triệu token của từng mô hình được công bố tại /pricing — có thể so sánh với bảng niêm yết upstream bất cứ lúc nào.

  • Có. Chúng tôi triển khai trọn bộ endpoint của OpenAI: /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models và /v1/video/generations. Streaming, function calling, vision và tool use hoạt động y hệt. Các dự án dùng SDK OpenAI chuyển đổi chỉ bằng cách thay base_url — chỉ vậy thôi.

  • Không. Kunavo là một ví trả trước. Số tiền nạp ở lại trong tài khoản của bạn mãi mãi — không đăng ký định kỳ, không tối thiểu hàng tháng, không hết hạn. Đóng tài khoản sẽ hoàn số dư còn lại về phương thức thanh toán ban đầu.

  • Không bao giờ. Phản hồi 4xx và 5xx không bị tính phí. Phản hồi streaming bị ngắt giữa chừng chỉ bị tính phí cho những token đã thực sự được gửi đi. Mọi khoản phí đều hiển thị theo từng lượt gọi trên dashboard mức dùng, có thể xuất ra CSV để hạch toán.

  • Mọi thứ Stripe hỗ trợ: thẻ (Visa, Mastercard, Amex, JCB, UnionPay), Apple Pay, Google Pay, Link, ACH, SEPA, BACS, BECS, Alipay, WeChat Pay, Klarna, Afterpay và nhiều hơn nữa. Tự động nạp là tùy chọn bật. Khách hàng Enterprise có thể thanh toán qua hóa đơn với điều khoản Net 30.

  • Các node edge được triển khai ở Bắc Mỹ, châu Âu và châu Á - Thái Bình Dương. Logic routing stateless chạy tại edge để đạt độ trễ P50 dưới 120 ms. Dữ liệu thanh toán, tài khoản và log kiểm toán được lưu ở một vùng chính với sao chép đa vùng.

Ba phút đến lượt gọi đầu tiên của bạn.

Một API tương thích OpenAI duy nhất cho Claude, Gemini, GPT-Image và hơn 200 mô hình khác — nạp tối thiểu $5, bạn chỉ trả cho những gì bạn gọi.