퓨샷 프롬프팅: 말로 설명하지 말고 예시로 기준을 심어라
퓨샷 프롬프팅: 말로 설명하지 말고 예시로 기준을 심어라
먼저 결론
퓨샷 프롬프팅은 AI에게 예시를 보여주고 같은 방식으로 답하게 만드는 기술입니다. 프롬프트를 아무리 길게 설명해도 모델이 내 기준을 다르게 이해할 때가 있습니다. 그럴 때는 설명을 더 붙이는 것보다 예시를 보여주는 편이 빠릅니다.
이 글은 퓨샷을 "예시 몇 개 넣으면 좋아진다" 수준이 아니라, 실제 업무에서 재사용할 수 있는 기준 설계법으로 정리합니다.
퓨샷을 한 문장으로 정의하면
퓨샷은 모델에게 규칙을 말로만 설명하지 않고, 입력과 출력 예시를 함께 보여줘서 패턴을 학습하게 만드는 프롬프팅 방식입니다.
OpenAI의 프롬프트 엔지니어링 문서도 few-shot learning을 입력/출력 예시를 프롬프트에 포함해 모델을 원하는 작업 방향으로 유도하는 방법으로 설명합니다. 특히 다양한 입력과 원하는 출력을 함께 보여주는 것이 중요합니다.
참고: OpenAI Prompt engineering: Few-shot learning
왜 말보다 예시가 강한가
"전문적으로 써줘"라는 말은 모호합니다. 어떤 사람에게 전문적이라는 말은 딱딱한 문장이고, 어떤 사람에게는 근거가 충분한 글입니다. "짧게 정리해줘"도 마찬가지입니다. 한 문장을 원하는지, 세 줄을 원하는지, 표를 원하는지 모델은 추측합니다.
퓨샷은 이 추측을 줄입니다.
예시는 모델에게 네 가지를 동시에 알려줍니다.
- 어떤 입력을 받을지
- 어떤 출력을 내야 하는지
- 어떤 라벨이나 표현을 써야 하는지
- 애매한 상황에서 어떻게 판단해야 하는지
실패하는 퓨샷
아래 문장을 감정 분석해줘.
예시:
좋아요 -> 긍정
별로예요 -> 부정
문장:
배송은 늦었지만 제품은 마음에 들어요.
이 프롬프트는 너무 빈약합니다. 복합 감정이 있을 때 어떻게 처리할지 기준이 없습니다. 배송 문제와 제품 만족이 동시에 있을 때 어느 쪽을 우선해야 하는지도 없습니다.
결과적으로 모델은 긍정 또는 부정 중 하나를 대충 고릅니다.
더 나은 퓨샷
역할:
너는 쇼핑몰 리뷰를 분석하는 분류 도우미다.
출력 형식:
[감정/주제] - 한 줄 근거
예시:
입력: 배송이 너무 느려요. 다시는 안 살래요.
출력: [부정/배송] - 배송 지연이 재구매 의사에 영향을 줌
입력: 상담원분이 빠르게 교환 처리해줬어요.
출력: [긍정/고객지원] - 교환 처리 경험을 긍정적으로 평가함
입력: 색상은 사진보다 어둡지만 착용감은 좋아요.
출력: [혼합/품질] - 색상 불만과 착용감 만족이 함께 나타남
입력: 언제 재입고되나요?
출력: [중립/문의] - 구매 평가가 아니라 재입고 질문임
이제 아래 입력을 같은 기준으로 분류해줘.
입력:
배송은 늦었지만 제품은 마음에 들어요.
출력:
좋은 퓨샷은 단순히 예시가 많은 것이 아닙니다. 기준이 드러나는 예시가 있어야 합니다.
좋은 예시를 고르는 기준
| 예시 유형 | 넣어야 하는 이유 | 예 |
|---|---|---|
| 대표 사례 | 가장 흔한 입력을 안정적으로 처리 | 명확한 긍정 리뷰 |
| 경계 사례 | 애매한 입력에서 기준을 잡음 | 좋지만 아쉬운 리뷰 |
| 예외 사례 | 모델이 잘못 분류하기 쉬운 입력을 방지 | 질문형 문장 |
| 실패 방지 사례 | 하면 안 되는 출력을 막음 | 정보 부족 시 확인 필요 |
예시는 보통 3~5개면 충분합니다. 중요한 것은 개수가 아니라 다양성입니다.
템플릿 1: 뉴스 요약용 퓨샷
아래 예시와 같은 형식으로 뉴스를 요약해줘.
출력 형식:
- 핵심 이슈:
- 왜 중요한가:
- 확인해야 할 점:
- 출처 성격:
예시 1:
입력: 정부가 AI 인재 양성 계획을 발표했다.
출력:
- 핵심 이슈: AI 인재 양성 정책 발표
- 왜 중요한가: 기업의 채용과 교육 시장에 영향을 줄 수 있음
- 확인해야 할 점: 예산 규모, 집행 일정, 참여 기관
- 출처 성격: 정책 발표
예시 2:
입력: 한 스타트업이 AI 검색 서비스를 출시했다.
출력:
- 핵심 이슈: AI 검색 서비스 출시
- 왜 중요한가: 기존 검색 UX와 업무 자동화 흐름에 영향을 줄 수 있음
- 확인해야 할 점: 실제 성능, 가격, 데이터 출처
- 출처 성격: 제품 발표
예시 3:
입력: 한 기업이 자체 AI 성능이 크게 향상됐다고 밝혔다.
출력:
- 핵심 이슈: 기업의 AI 성능 개선 주장
- 왜 중요한가: 실제 도입 가능성과 경쟁 구도에 영향을 줄 수 있음
- 확인해야 할 점: 벤치마크 조건, 독립 검증 여부, 사용 비용
- 출처 성격: 기업 발표
이제 아래 입력을 같은 형식으로 요약해줘.
입력:
[뉴스 본문]
이 템플릿은 뉴스 브리핑을 만들 때 특히 좋습니다. 단순 요약이 아니라 "확인해야 할 점"을 강제로 남기기 때문입니다.
템플릿 2: 블로그 도입부 톤 맞추기
아래 예시의 문체를 기준으로 새 도입부를 써줘.
문체 기준:
- 첫 문장은 짧게 시작한다.
- 추상어보다 실제 상황을 먼저 보여준다.
- 과장하지 않는다.
- 마지막 문장은 독자가 계속 읽을 이유를 만든다.
예시 1:
입력: AI 도구를 잘 쓰는 방법
출력: AI 도구는 많다. 그런데 하루를 바꾸는 도구는 몇 개 되지 않는다. 중요한 건 새 도구를 모으는 일이 아니라, 반복 작업 하나를 확실히 줄이는 것이다.
예시 2:
입력: 프롬프트를 잘 쓰는 법
출력: 좋은 프롬프트는 긴 문장이 아니다. 원하는 결과가 무엇인지, 실패하면 안 되는 조건이 무엇인지, 어떤 형식으로 받아야 하는지 선명한 문장이다.
새 입력:
[주제]
출력:
도입부는 "멋진 문장"보다 "읽을 이유"가 먼저입니다. 퓨샷은 그 감각을 모델에게 빠르게 전달합니다.
템플릿 3: JSON 출력 고정
아래 예시와 같은 JSON만 출력해줘.
설명 문장, 마크다운, 코드블록은 쓰지 마.
예시 1:
입력: 고객이 배송 지연에 화가 났다.
출력:
{
"sentiment": "negative",
"topic": "delivery",
"urgency": "high",
"reason": "배송 지연으로 강한 불만을 표현함"
}
예시 2:
입력: 고객이 제품 색상을 문의했다.
출력:
{
"sentiment": "neutral",
"topic": "product_question",
"urgency": "medium",
"reason": "구매 전 정보 확인 목적의 질문임"
}
이제 아래 입력을 같은 JSON 형식으로 처리해줘.
입력:
[입력]
JSON이 자주 깨진다면 예시에 코드블록을 넣지 않는 편이 좋습니다. 모델이 코드블록까지 형식으로 배울 수 있기 때문입니다.
템플릿 4: 고객 문의 답변 톤 고정
아래 예시의 톤으로 고객 문의에 답변해줘.
톤 기준:
- 먼저 불편을 인정한다.
- 변명하지 않는다.
- 가능한 조치를 구체적으로 말한다.
- 마지막에 추가 확인 질문을 하나만 남긴다.
예시 1:
문의: 주문한 상품이 아직 안 왔어요.
답변: 기다리게 해드려 죄송합니다. 주문 번호를 확인한 뒤 현재 배송 위치와 예상 도착일을 바로 확인하겠습니다. 주문 번호를 알려주시겠어요?
예시 2:
문의: 환불은 언제 되나요?
답변: 환불 일정이 궁금하셨군요. 결제 수단에 따라 보통 2~5영업일 안에 처리됩니다. 제가 정확히 확인할 수 있도록 결제일과 주문 번호를 알려주세요.
새 문의:
[고객 문의]
답변:
고객 응대에서는 퓨샷이 특히 강합니다. "친절하게"라는 말보다 실제 답변 예시가 훨씬 명확하기 때문입니다.
템플릿 5: 콘텐츠 분류 태그 만들기
아래 기준으로 콘텐츠 태그를 붙여줘.
출력 형식:
[대분류 > 소분류] 키워드 3개
예시:
입력: ChatGPT로 회의록을 자동 요약하는 방법
출력: [AI 활용 > 업무 자동화] 회의록, 요약, 생산성
입력: Next.js에서 메타데이터를 설정하는 방법
출력: [개발 > 프론트엔드] Next.js, SEO, 메타데이터
입력: 프롬프트 예시를 넣어 답변 품질을 높이는 방법
출력: [AI 활용 > 프롬프트] Few-shot, 예시, 출력형식
새 입력:
[제목 또는 설명]
출력:
이 템플릿은 블로그, 보물창고, 뉴스 브리핑 아카이브를 정리할 때 쓸 수 있습니다.
템플릿 6: before/after 리라이트
아래 예시처럼 밋밋한 문장을 더 구체적인 문장으로 바꿔줘.
규칙:
- 과장하지 않는다.
- 추상어를 줄인다.
- 독자가 얻는 결과를 보여준다.
- 문장은 너무 길게 만들지 않는다.
예시 1:
Before: AI를 활용하면 업무 효율이 좋아집니다.
After: 반복 보고서 작성에 쓰던 2시간을 초안 검토 20분으로 줄일 수 있습니다.
예시 2:
Before: 이 프롬프트는 매우 유용합니다.
After: 같은 형식의 요약을 매번 다시 설명하지 않아도 됩니다.
이제 아래 문장을 같은 방식으로 바꿔줘.
Before:
[문장]
After:
카피라이팅에서 퓨샷은 추상어를 구체어로 바꾸는 데 좋습니다.
결과가 이상할 때 디버깅하는 법
1. 모델이 예시를 그대로 베낄 때
예시와 실제 입력이 너무 비슷할 수 있습니다.
예시는 형식과 판단 기준을 배우기 위한 참고용이야.
새 입력의 고유한 정보만 사용해서 답해줘.
2. 출력 형식이 깨질 때
출력 형식을 예시마다 완전히 같게 맞춰야 합니다.
모든 출력은 아래 4개 필드만 사용해.
필드명을 바꾸지 마.
추가 필드를 만들지 마.
3. 답변이 너무 일반적일 때
경계 사례와 예외 사례가 부족한 것입니다.
아래 예시에는 애매한 케이스와 예외 케이스가 포함되어 있어.
새 입력도 같은 기준으로 판단해줘.
4. 라벨이 흔들릴 때
라벨 정의를 예시 앞에 추가합니다.
라벨 정의:
- 긍정: 만족, 추천, 재구매 의사가 명확함
- 부정: 불만, 환불, 재구매 거부가 명확함
- 혼합: 장점과 단점이 함께 있음
- 중립: 평가가 아니라 질문 또는 정보 요청임
실무 워크플로우
퓨샷은 처음부터 완벽하게 만들기보다 운영하면서 좋아집니다.
- 먼저 zero-shot으로 시도합니다.
- 결과가 흔들리는 지점을 찾습니다.
- 흔들린 케이스를 예시로 추가합니다.
- 예시가 6개 이상 늘어나면 중복을 줄입니다.
- 자주 쓰는 작업은 템플릿으로 저장합니다.
가장 좋은 예시는 성공 사례가 아니라 실패를 고친 사례입니다. 모델이 자주 틀리는 입력을 예시로 넣으면 프롬프트가 빠르게 안정됩니다.
체크리스트
- 입력/출력 예시가 최소 3개 있는가
- 대표 사례, 경계 사례, 예외 사례가 섞여 있는가
- 모든 출력 형식이 완전히 같은가
- 라벨 기준이 예시에서 드러나는가
- 실제 입력 직전에 "같은 기준으로"라고 연결했는가
- 예시가 너무 많아 토큰을 낭비하고 있지는 않은가
- 결과 검수 기준을 따로 남겼는가
주의할 점
퓨샷은 기준을 심는 기술이지 사실 검증을 대신하는 기술은 아닙니다. 모델이 예시 패턴을 잘 따라도, 내용 자체가 틀릴 수 있습니다.
특히 의료, 금융, 법률처럼 책임이 큰 영역에서는 퓨샷으로 답변 형식을 안정화할 수는 있어도 최종 판단은 전문가 검토가 필요합니다.
또한 예시에 편향이 있으면 출력도 편향됩니다. 예시가 모두 긍정 사례라면 모델은 애매한 입력도 긍정으로 분류하려고 할 수 있습니다. 좋은 퓨샷은 다양한 예시를 보여줍니다.