Back to blog
구현 가이드·May 25, 2026·7 min read

한국어 콜센터 AI 자동화 — Claude Haiku로 100분의 1 비용에 처리하기

한국 SaaS / 이커머스 회사들이 가장 빠르게 AI를 도입하는 영역: 고객 응대 자동화. Haiku로 분류, Sonnet으로 응답 생성, prompt caching으로 비용 90% 절감. 한 건당 10원, 월 일 1,000건 처리 비용 28만원. 한국어 존대법 일관성 + 개인정보보호법 준수 포함.

한국 SaaS / 이커머스 회사들이 가장 빠르게 AI를 도입하는 곳은 고객 응대 자동화입니다. 사람이 전부 처리하면 월 수천만 원이지만, Claude로 분류 + 응답 초안을 자동화하면 90% 이상 비용을 줄일 수 있습니다. 이 글은 실제 운영 가능한 코드와 비용을 공개합니다.

구조

  1. 들어온 티켓을 Claude Haiku 4.5로 분류 (가장 저렴)
  2. 유사 과거 사례를 검색 (벡터 DB)
  3. Claude Sonnet 4.6으로 응답 초안 생성
  4. 상담원이 검토 후 발송 (또는 우선순위 낮음은 자동 발송)

1단계: 분류 — Claude Haiku 4.5

Haiku 4.5는 분류 같은 단순 작업에 매우 저렴합니다. Kunavo 가격으로 입력 $0.56/1M, 출력 $2.80/1M. 한국어 200자 티켓 + JSON 출력 50토큰 = 한 건당 약 $0.00006 (한화 0.08원).

classify.py
from openai import OpenAI

client = OpenAI(
    api_key="sk-kunavo-...",
    base_url="https://api.kunavo.com/v1",
)

def classify_ticket(text: str) -> dict:
    """들어온 고객 문의를 카테고리 + 우선순위로 분류."""
    resp = client.chat.completions.create(
        model="claude-haiku-4-5",  # 가장 저렴, 분류엔 충분
        messages=[
            {
                "role": "system",
                "content": (
                    "당신은 한국어 고객 문의 분류기입니다. "
                    "다음 JSON 형식으로만 응답하세요: "
                    '{"category": "결제|배송|반품|기술|기타", '
                    '"priority": "긴급|보통|낮음", '
                    '"summary": "한 문장 요약"}'
                ),
            },
            {"role": "user", "content": text},
        ],
        response_format={"type": "json_object"},
        max_tokens=200,
    )
    return json.loads(resp.choices[0].message.content)

2단계: 유사 사례 검색

과거 잘 처리된 응답 사례를 임베딩 + pgvector로 저장해뒀다가, 새 티켓의 임베딩과 코사인 유사도로 상위 5건을 검색합니다. text-embedding-3-large 1건당 약 $0.0000025 (한화 0.003원).

3단계: 응답 초안 생성 — Claude Sonnet 4.6 + prompt caching

reply.py
def generate_reply(ticket: dict, context: list[str]) -> str:
    """과거 유사 사례 5건을 참조해 응답 초안 생성."""
    references = "\n\n".join(context)
    resp = client.chat.completions.create(
        model="claude-sonnet-4-6",  # 응답 품질은 Sonnet
        messages=[
            {
                "role": "system",
                "content": [
                    {
                        "type": "text",
                        "text": COMPANY_GUIDELINES,  # 회사 톤 & 정책
                        "cache_control": {"type": "ephemeral"},
                    },
                ],
            },
            {
                "role": "user",
                "content": (
                    f"## 고객 문의\n{ticket['original_text']}\n\n"
                    f"## 분류\n{ticket['category']} / {ticket['priority']}\n\n"
                    f"## 참고할 과거 응답 (5건)\n{references}\n\n"
                    "## 작성 지침\n"
                    "1. 정중한 격식체 (~습니다)\n"
                    "2. 3문단 이내\n"
                    "3. 다음 단계가 무엇인지 명확히 안내\n"
                ),
            },
        ],
        max_tokens=600,
    )
    return resp.choices[0].message.content

회사 가이드라인 (3,000 토큰)은 매번 같으므로 cache_control로 캐싱합니다. 2번째 호출부터는 그 부분이 입력 요금의 10%만 부과됩니다.

한 건당 비용 추정 (caching 적용 후):

  • 분류 (Haiku 4.5): $0.00006
  • 검색 임베딩: $0.0000025
  • 응답 생성 (Sonnet 4.6, 캐시 히트): 입력 약 1K 토큰 + 출력 500 토큰 = $0.0073
  • 합계: 약 $0.007 (한화 약 10원)

월간 비용 예시

  • 일 100건: 월 $21 (약 2.8만원)
  • 일 1,000건: 월 $210 (약 28만원)
  • 일 10,000건: 월 $2,100 (약 280만원)

비교: 상담원 1명 = 월 약 250만원, 일 100건 처리 한계. 일 1,000건 처리하려면 10명 = 월 2,500만원. AI 자동화로 100배 비용 차이.

한국 환경 특화 고려사항

  • 존대법 일관성: 시스템 프롬프트에 "정중한 격식체 (~습니다)" 반복 명시. 변종은 면접관 평가처럼 응답 100건 샘플링 후 시행
  • 한국어 토큰 소비: 한국어는 영어 대비 1.5-2배 토큰 소비. 위 비용 추정은 한국어 기준
  • 개인정보보호법 준수: 고객 PII (이름, 전화번호, 주소)는 시스템 프롬프트에 절대 넣지 마세요. 마스킹 후 LLM으로 전달
  • 결제 방식: 국제 카드, Apple Pay, Google Pay 모두 가능. 기업은 세금계산서가 필요하면 sales@kunavo.com에 문의

도입 체크리스트

  • 처음 100건은 상담원이 100% 검토 → 정확도 90%+ 확인 후 점진 자동화
  • 긴급 카테고리는 항상 사람이 검토 (오류 비용이 높음)
  • 매주 잘못 분류된 케이스를 가이드라인에 추가 (반복 학습)
  • 월간 사용량은 /app/usage에서 추적, 일일 캡은/app/keys에서 설정 (실수로 폭주 방지)

시작하려면 무료 가입하고 $2 크레딧을 받으세요. 전체 문서: /docs/quickstart, 프롬프트 캐싱 가이드: prompt caching deep dive.