한국 SaaS / 이커머스 회사들이 가장 빠르게 AI를 도입하는 곳은 고객 응대 자동화입니다. 사람이 전부 처리하면 월 수천만 원이지만, Claude로 분류 + 응답 초안을 자동화하면 90% 이상 비용을 줄일 수 있습니다. 이 글은 실제 운영 가능한 코드와 비용을 공개합니다.
구조
- 들어온 티켓을 Claude Haiku 4.5로 분류 (가장 저렴)
- 유사 과거 사례를 검색 (벡터 DB)
- Claude Sonnet 4.6으로 응답 초안 생성
- 상담원이 검토 후 발송 (또는 우선순위 낮음은 자동 발송)
1단계: 분류 — Claude Haiku 4.5
Haiku 4.5는 분류 같은 단순 작업에 매우 저렴합니다. Kunavo 가격으로 입력 $0.56/1M, 출력 $2.80/1M. 한국어 200자 티켓 + JSON 출력 50토큰 = 한 건당 약 $0.00006 (한화 0.08원).
from openai import OpenAI
client = OpenAI(
api_key="sk-kunavo-...",
base_url="https://api.kunavo.com/v1",
)
def classify_ticket(text: str) -> dict:
"""들어온 고객 문의를 카테고리 + 우선순위로 분류."""
resp = client.chat.completions.create(
model="claude-haiku-4-5", # 가장 저렴, 분류엔 충분
messages=[
{
"role": "system",
"content": (
"당신은 한국어 고객 문의 분류기입니다. "
"다음 JSON 형식으로만 응답하세요: "
'{"category": "결제|배송|반품|기술|기타", '
'"priority": "긴급|보통|낮음", '
'"summary": "한 문장 요약"}'
),
},
{"role": "user", "content": text},
],
response_format={"type": "json_object"},
max_tokens=200,
)
return json.loads(resp.choices[0].message.content)2단계: 유사 사례 검색
과거 잘 처리된 응답 사례를 임베딩 + pgvector로 저장해뒀다가, 새 티켓의 임베딩과 코사인 유사도로 상위 5건을 검색합니다. text-embedding-3-large 1건당 약 $0.0000025 (한화 0.003원).
3단계: 응답 초안 생성 — Claude Sonnet 4.6 + prompt caching
def generate_reply(ticket: dict, context: list[str]) -> str:
"""과거 유사 사례 5건을 참조해 응답 초안 생성."""
references = "\n\n".join(context)
resp = client.chat.completions.create(
model="claude-sonnet-4-6", # 응답 품질은 Sonnet
messages=[
{
"role": "system",
"content": [
{
"type": "text",
"text": COMPANY_GUIDELINES, # 회사 톤 & 정책
"cache_control": {"type": "ephemeral"},
},
],
},
{
"role": "user",
"content": (
f"## 고객 문의\n{ticket['original_text']}\n\n"
f"## 분류\n{ticket['category']} / {ticket['priority']}\n\n"
f"## 참고할 과거 응답 (5건)\n{references}\n\n"
"## 작성 지침\n"
"1. 정중한 격식체 (~습니다)\n"
"2. 3문단 이내\n"
"3. 다음 단계가 무엇인지 명확히 안내\n"
),
},
],
max_tokens=600,
)
return resp.choices[0].message.content회사 가이드라인 (3,000 토큰)은 매번 같으므로 cache_control로 캐싱합니다. 2번째 호출부터는 그 부분이 입력 요금의 10%만 부과됩니다.
한 건당 비용 추정 (caching 적용 후):
- 분류 (Haiku 4.5): $0.00006
- 검색 임베딩: $0.0000025
- 응답 생성 (Sonnet 4.6, 캐시 히트): 입력 약 1K 토큰 + 출력 500 토큰 = $0.0073
- 합계: 약 $0.007 (한화 약 10원)
월간 비용 예시
- 일 100건: 월 $21 (약 2.8만원)
- 일 1,000건: 월 $210 (약 28만원)
- 일 10,000건: 월 $2,100 (약 280만원)
비교: 상담원 1명 = 월 약 250만원, 일 100건 처리 한계. 일 1,000건 처리하려면 10명 = 월 2,500만원. AI 자동화로 100배 비용 차이.
한국 환경 특화 고려사항
- 존대법 일관성: 시스템 프롬프트에 "정중한 격식체 (~습니다)" 반복 명시. 변종은 면접관 평가처럼 응답 100건 샘플링 후 시행
- 한국어 토큰 소비: 한국어는 영어 대비 1.5-2배 토큰 소비. 위 비용 추정은 한국어 기준
- 개인정보보호법 준수: 고객 PII (이름, 전화번호, 주소)는 시스템 프롬프트에 절대 넣지 마세요. 마스킹 후 LLM으로 전달
- 결제 방식: 국제 카드, Apple Pay, Google Pay 모두 가능. 기업은 세금계산서가 필요하면 sales@kunavo.com에 문의
도입 체크리스트
- 처음 100건은 상담원이 100% 검토 → 정확도 90%+ 확인 후 점진 자동화
- 긴급 카테고리는 항상 사람이 검토 (오류 비용이 높음)
- 매주 잘못 분류된 케이스를 가이드라인에 추가 (반복 학습)
- 월간 사용량은 /app/usage에서 추적, 일일 캡은/app/keys에서 설정 (실수로 폭주 방지)
시작하려면 무료 가입하고 $2 크레딧을 받으세요. 전체 문서: /docs/quickstart, 프롬프트 캐싱 가이드: prompt caching deep dive.