한국 SaaS / 이커머스 회사들이 가장 빠르게 AI를 도입하는 곳은 고객 응대 자동화입니다. 사람이 전부 처리하면 월 수천만 원이지만, Claude로 분류 + 응답 초안을 자동화하면 90% 이상 비용을 줄일 수 있습니다. 이 글은 실제 운영 가능한 코드와 비용을 공개합니다.

구조

들어온 티켓을 Claude Haiku 4.5로 분류 (가장 저렴)
유사 과거 사례를 검색 (벡터 DB)
Claude Sonnet 4.6으로 응답 초안 생성
상담원이 검토 후 발송 (또는 우선순위 낮음은 자동 발송)

1단계: 분류 — Claude Haiku 4.5

Haiku 4.5는 분류 같은 단순 작업에 매우 저렴합니다. Kunavo 가격으로 입력 $0.40/1M, 출력 $2.00/1M. 한국어 200자 티켓 + JSON 출력 50토큰 = 한 건당 약 $0.00004 (한화 0.06원).

classify.py

from openai import OpenAI

client = OpenAI(
    api_key="sk-kunavo-...",
    base_url="https://api.kunavo.com/v1",
)

def classify_ticket(text: str) -> dict:
    """들어온 고객 문의를 카테고리 + 우선순위로 분류."""
    resp = client.chat.completions.create(
        model="claude-haiku-4-5",  # 가장 저렴, 분류엔 충분
        messages=[
            {
                "role": "system",
                "content": (
                    "당신은 한국어 고객 문의 분류기입니다. "
                    "다음 JSON 형식으로만 응답하세요: "
                    '{"category": "결제|배송|반품|기술|기타", '
                    '"priority": "긴급|보통|낮음", '
                    '"summary": "한 문장 요약"}'
                ),
            },
            {"role": "user", "content": text},
        ],
        response_format={"type": "json_object"},
        max_tokens=200,
    )
    return json.loads(resp.choices[0].message.content)

2단계: 유사 사례 검색

과거 잘 처리된 응답 사례를 임베딩 + pgvector로 저장해뒀다가, 새 티켓의 임베딩과 코사인 유사도로 상위 5건을 검색합니다. text-embedding-3-large 1건당 약 $0.0000025 (한화 0.003원).

3단계: 응답 초안 생성 — Claude Sonnet 4.6 + prompt caching

reply.py

def generate_reply(ticket: dict, context: list[str]) -> str:
    """과거 유사 사례 5건을 참조해 응답 초안 생성."""
    references = "\n\n".join(context)
    resp = client.chat.completions.create(
        model="claude-sonnet-4-6",  # 응답 품질은 Sonnet
        messages=[
            {
                "role": "system",
                "content": [
                    {
                        "type": "text",
                        "text": COMPANY_GUIDELINES,  # 회사 톤 & 정책
                        "cache_control": {"type": "ephemeral"},
                    },
                ],
            },
            {
                "role": "user",
                "content": (
                    f"## 고객 문의\n{ticket['original_text']}\n\n"
                    f"## 분류\n{ticket['category']} / {ticket['priority']}\n\n"
                    f"## 참고할 과거 응답 (5건)\n{references}\n\n"
                    "## 작성 지침\n"
                    "1. 정중한 격식체 (~습니다)\n"
                    "2. 3문단 이내\n"
                    "3. 다음 단계가 무엇인지 명확히 안내\n"
                ),
            },
        ],
        max_tokens=600,
    )
    return resp.choices[0].message.content

회사 가이드라인 (3,000 토큰)은 매번 같으므로 cache_control로 캐싱합니다. 2번째 호출부터는 그 부분이 입력 요금의 10%만 부과됩니다.

한 건당 비용 추정 (caching 적용 후):

분류 (Haiku 4.5): $0.00006
검색 임베딩: $0.0000025
응답 생성 (Sonnet 4.6, 캐시 히트): 입력 약 1K 토큰 + 출력 500 토큰 = $0.0042
합계: 약 $0.004 (한화 약 6원)

월간 비용 예시

일 100건: 월 $13 (약 1.8만원)
일 1,000건: 월 $130 (약 18만원)
일 10,000건: 월 $1,300 (약 180만원)

비교: 상담원 1명 = 월 약 250만원, 일 100건 처리 한계. 일 1,000건 처리하려면 10명 = 월 2,500만원. AI 자동화로 100배 이상 비용 차이.

한국 환경 특화 고려사항

존대법 일관성: 시스템 프롬프트에 "정중한 격식체 (~습니다)" 반복 명시. 변종은 면접관 평가처럼 응답 100건 샘플링 후 시행
한국어 토큰 소비: 한국어는 영어 대비 1.5-2배 토큰 소비. 위 비용 추정은 한국어 기준
개인정보보호법 준수: 고객 PII (이름, 전화번호, 주소)는 시스템 프롬프트에 절대 넣지 마세요. 마스킹 후 LLM으로 전달
결제 방식: 국제 카드, Apple Pay, Google Pay 모두 가능. 기업은 세금계산서가 필요하면 sales@kunavo.com에 문의

도입 체크리스트

처음 100건은 상담원이 100% 검토 → 정확도 90%+ 확인 후 점진 자동화
긴급 카테고리는 항상 사람이 검토 (오류 비용이 높음)
매주 잘못 분류된 케이스를 가이드라인에 추가 (반복 학습)
월간 사용량은 /app/usage에서 추적, 일일 캡은/app/keys에서 설정 (실수로 폭주 방지)

시작하려면 무료 가입 후 $5부터 충전해 종량제로 사용하세요. 모델별 단가와 결제 방법은 Claude API 가격·결제 정리와 가격 페이지에서 확인하고, OpenRouter와 비교는 OpenRouter 대안 비교를 보세요. 전체 문서: /docs/quickstart, 프롬프트 캐싱 가이드: prompt caching deep dive.

한국어 콜센터 AI 자동화 — Claude Haiku로 100분의 1 비용에 처리하기

구조

1단계: 분류 — Claude Haiku 4.5

2단계: 유사 사례 검색

3단계: 응답 초안 생성 — Claude Sonnet 4.6 + prompt caching

월간 비용 예시

한국 환경 특화 고려사항

도입 체크리스트

Related deep dives

한국에서 Claude API 결제·비용·요금 — 국내 카드로 시작하는 빠른 가이드

在中国稳定调用 Claude / GPT / Gemini — Kunavo 中国友好路由实测

用 Veo 3 為台灣品牌做短影片廣告（Sora 同端點待上線）— 5 分鐘完整教學

日本語 RAG チャットボットを Claude で構築 — 5,000 文書のナレッジベースを 30 行で