프롬프트2026-02-016분 읽기

퓨샷 프롬프팅: 말로 설명하지 말고 예시로 기준을 심어라

먼저 결론

퓨샷 프롬프팅은 AI에게 예시를 보여주고 같은 방식으로 답하게 만드는 기술입니다. 프롬프트를 아무리 길게 설명해도 모델이 내 기준을 다르게 이해할 때가 있습니다. 그럴 때는 설명을 더 붙이는 것보다 예시를 보여주는 편이 빠릅니다.

이 글은 퓨샷을 "예시 몇 개 넣으면 좋아진다" 수준이 아니라, 실제 업무에서 재사용할 수 있는 기준 설계법으로 정리합니다.

퓨샷을 한 문장으로 정의하면

퓨샷은 모델에게 규칙을 말로만 설명하지 않고, 입력과 출력 예시를 함께 보여줘서 패턴을 학습하게 만드는 프롬프팅 방식입니다.

OpenAI의 프롬프트 엔지니어링 문서도 few-shot learning을 입력/출력 예시를 프롬프트에 포함해 모델을 원하는 작업 방향으로 유도하는 방법으로 설명합니다. 특히 다양한 입력과 원하는 출력을 함께 보여주는 것이 중요합니다.
참고: OpenAI Prompt engineering: Few-shot learning

왜 말보다 예시가 강한가

"전문적으로 써줘"라는 말은 모호합니다. 어떤 사람에게 전문적이라는 말은 딱딱한 문장이고, 어떤 사람에게는 근거가 충분한 글입니다. "짧게 정리해줘"도 마찬가지입니다. 한 문장을 원하는지, 세 줄을 원하는지, 표를 원하는지 모델은 추측합니다.

퓨샷은 이 추측을 줄입니다.

예시는 모델에게 네 가지를 동시에 알려줍니다.

어떤 입력을 받을지
어떤 출력을 내야 하는지
어떤 라벨이나 표현을 써야 하는지
애매한 상황에서 어떻게 판단해야 하는지

실패하는 퓨샷

아래 문장을 감정 분석해줘.

예시:
좋아요 -> 긍정
별로예요 -> 부정

문장:
배송은 늦었지만 제품은 마음에 들어요.

이 프롬프트는 너무 빈약합니다. 복합 감정이 있을 때 어떻게 처리할지 기준이 없습니다. 배송 문제와 제품 만족이 동시에 있을 때 어느 쪽을 우선해야 하는지도 없습니다.

결과적으로 모델은 긍정 또는 부정 중 하나를 대충 고릅니다.

더 나은 퓨샷

역할:
너는 쇼핑몰 리뷰를 분석하는 분류 도우미다.

출력 형식:
[감정/주제] - 한 줄 근거

예시:
입력: 배송이 너무 느려요. 다시는 안 살래요.
출력: [부정/배송] - 배송 지연이 재구매 의사에 영향을 줌

입력: 상담원분이 빠르게 교환 처리해줬어요.
출력: [긍정/고객지원] - 교환 처리 경험을 긍정적으로 평가함

입력: 색상은 사진보다 어둡지만 착용감은 좋아요.
출력: [혼합/품질] - 색상 불만과 착용감 만족이 함께 나타남

입력: 언제 재입고되나요?
출력: [중립/문의] - 구매 평가가 아니라 재입고 질문임

이제 아래 입력을 같은 기준으로 분류해줘.

입력:
배송은 늦었지만 제품은 마음에 들어요.

출력:

좋은 퓨샷은 단순히 예시가 많은 것이 아닙니다. 기준이 드러나는 예시가 있어야 합니다.

좋은 예시를 고르는 기준

예시 유형	넣어야 하는 이유	예
대표 사례	가장 흔한 입력을 안정적으로 처리	명확한 긍정 리뷰
경계 사례	애매한 입력에서 기준을 잡음	좋지만 아쉬운 리뷰
예외 사례	모델이 잘못 분류하기 쉬운 입력을 방지	질문형 문장
실패 방지 사례	하면 안 되는 출력을 막음	정보 부족 시 확인 필요

예시는 보통 3~5개면 충분합니다. 중요한 것은 개수가 아니라 다양성입니다.

템플릿 1: 뉴스 요약용 퓨샷

아래 예시와 같은 형식으로 뉴스를 요약해줘.

출력 형식:
- 핵심 이슈:
- 왜 중요한가:
- 확인해야 할 점:
- 출처 성격:

예시 1:
입력: 정부가 AI 인재 양성 계획을 발표했다.
출력:
- 핵심 이슈: AI 인재 양성 정책 발표
- 왜 중요한가: 기업의 채용과 교육 시장에 영향을 줄 수 있음
- 확인해야 할 점: 예산 규모, 집행 일정, 참여 기관
- 출처 성격: 정책 발표

예시 2:
입력: 한 스타트업이 AI 검색 서비스를 출시했다.
출력:
- 핵심 이슈: AI 검색 서비스 출시
- 왜 중요한가: 기존 검색 UX와 업무 자동화 흐름에 영향을 줄 수 있음
- 확인해야 할 점: 실제 성능, 가격, 데이터 출처
- 출처 성격: 제품 발표

예시 3:
입력: 한 기업이 자체 AI 성능이 크게 향상됐다고 밝혔다.
출력:
- 핵심 이슈: 기업의 AI 성능 개선 주장
- 왜 중요한가: 실제 도입 가능성과 경쟁 구도에 영향을 줄 수 있음
- 확인해야 할 점: 벤치마크 조건, 독립 검증 여부, 사용 비용
- 출처 성격: 기업 발표

이제 아래 입력을 같은 형식으로 요약해줘.

입력:
[뉴스 본문]

이 템플릿은 뉴스 브리핑을 만들 때 특히 좋습니다. 단순 요약이 아니라 "확인해야 할 점"을 강제로 남기기 때문입니다.

템플릿 2: 블로그 도입부 톤 맞추기

아래 예시의 문체를 기준으로 새 도입부를 써줘.

문체 기준:
- 첫 문장은 짧게 시작한다.
- 추상어보다 실제 상황을 먼저 보여준다.
- 과장하지 않는다.
- 마지막 문장은 독자가 계속 읽을 이유를 만든다.

예시 1:
입력: AI 도구를 잘 쓰는 방법
출력: AI 도구는 많다. 그런데 하루를 바꾸는 도구는 몇 개 되지 않는다. 중요한 건 새 도구를 모으는 일이 아니라, 반복 작업 하나를 확실히 줄이는 것이다.

예시 2:
입력: 프롬프트를 잘 쓰는 법
출력: 좋은 프롬프트는 긴 문장이 아니다. 원하는 결과가 무엇인지, 실패하면 안 되는 조건이 무엇인지, 어떤 형식으로 받아야 하는지 선명한 문장이다.

새 입력:
[주제]

출력:

도입부는 "멋진 문장"보다 "읽을 이유"가 먼저입니다. 퓨샷은 그 감각을 모델에게 빠르게 전달합니다.

템플릿 3: JSON 출력 고정

아래 예시와 같은 JSON만 출력해줘.
설명 문장, 마크다운, 코드블록은 쓰지 마.

예시 1:
입력: 고객이 배송 지연에 화가 났다.
출력:
{
  "sentiment": "negative",
  "topic": "delivery",
  "urgency": "high",
  "reason": "배송 지연으로 강한 불만을 표현함"
}

예시 2:
입력: 고객이 제품 색상을 문의했다.
출력:
{
  "sentiment": "neutral",
  "topic": "product_question",
  "urgency": "medium",
  "reason": "구매 전 정보 확인 목적의 질문임"
}

이제 아래 입력을 같은 JSON 형식으로 처리해줘.

입력:
[입력]

JSON이 자주 깨진다면 예시에 코드블록을 넣지 않는 편이 좋습니다. 모델이 코드블록까지 형식으로 배울 수 있기 때문입니다.

템플릿 4: 고객 문의 답변 톤 고정

아래 예시의 톤으로 고객 문의에 답변해줘.

톤 기준:
- 먼저 불편을 인정한다.
- 변명하지 않는다.
- 가능한 조치를 구체적으로 말한다.
- 마지막에 추가 확인 질문을 하나만 남긴다.

예시 1:
문의: 주문한 상품이 아직 안 왔어요.
답변: 기다리게 해드려 죄송합니다. 주문 번호를 확인한 뒤 현재 배송 위치와 예상 도착일을 바로 확인하겠습니다. 주문 번호를 알려주시겠어요?

예시 2:
문의: 환불은 언제 되나요?
답변: 환불 일정이 궁금하셨군요. 결제 수단에 따라 보통 2~5영업일 안에 처리됩니다. 제가 정확히 확인할 수 있도록 결제일과 주문 번호를 알려주세요.

새 문의:
[고객 문의]

답변:

고객 응대에서는 퓨샷이 특히 강합니다. "친절하게"라는 말보다 실제 답변 예시가 훨씬 명확하기 때문입니다.

템플릿 5: 콘텐츠 분류 태그 만들기

아래 기준으로 콘텐츠 태그를 붙여줘.

출력 형식:
[대분류 > 소분류] 키워드 3개

예시:
입력: ChatGPT로 회의록을 자동 요약하는 방법
출력: [AI 활용 > 업무 자동화] 회의록, 요약, 생산성

입력: Next.js에서 메타데이터를 설정하는 방법
출력: [개발 > 프론트엔드] Next.js, SEO, 메타데이터

입력: 프롬프트 예시를 넣어 답변 품질을 높이는 방법
출력: [AI 활용 > 프롬프트] Few-shot, 예시, 출력형식

새 입력:
[제목 또는 설명]

출력:

이 템플릿은 블로그, 보물창고, 뉴스 브리핑 아카이브를 정리할 때 쓸 수 있습니다.

템플릿 6: before/after 리라이트

아래 예시처럼 밋밋한 문장을 더 구체적인 문장으로 바꿔줘.

규칙:
- 과장하지 않는다.
- 추상어를 줄인다.
- 독자가 얻는 결과를 보여준다.
- 문장은 너무 길게 만들지 않는다.

예시 1:
Before: AI를 활용하면 업무 효율이 좋아집니다.
After: 반복 보고서 작성에 쓰던 2시간을 초안 검토 20분으로 줄일 수 있습니다.

예시 2:
Before: 이 프롬프트는 매우 유용합니다.
After: 같은 형식의 요약을 매번 다시 설명하지 않아도 됩니다.

이제 아래 문장을 같은 방식으로 바꿔줘.

Before:
[문장]

After:

카피라이팅에서 퓨샷은 추상어를 구체어로 바꾸는 데 좋습니다.

결과가 이상할 때 디버깅하는 법

1. 모델이 예시를 그대로 베낄 때

예시와 실제 입력이 너무 비슷할 수 있습니다.

예시는 형식과 판단 기준을 배우기 위한 참고용이야.
새 입력의 고유한 정보만 사용해서 답해줘.

2. 출력 형식이 깨질 때

출력 형식을 예시마다 완전히 같게 맞춰야 합니다.

모든 출력은 아래 4개 필드만 사용해.
필드명을 바꾸지 마.
추가 필드를 만들지 마.

3. 답변이 너무 일반적일 때

경계 사례와 예외 사례가 부족한 것입니다.

아래 예시에는 애매한 케이스와 예외 케이스가 포함되어 있어.
새 입력도 같은 기준으로 판단해줘.

4. 라벨이 흔들릴 때

라벨 정의를 예시 앞에 추가합니다.

라벨 정의:
- 긍정: 만족, 추천, 재구매 의사가 명확함
- 부정: 불만, 환불, 재구매 거부가 명확함
- 혼합: 장점과 단점이 함께 있음
- 중립: 평가가 아니라 질문 또는 정보 요청임

실무 워크플로우

퓨샷은 처음부터 완벽하게 만들기보다 운영하면서 좋아집니다.

먼저 zero-shot으로 시도합니다.
결과가 흔들리는 지점을 찾습니다.
흔들린 케이스를 예시로 추가합니다.
예시가 6개 이상 늘어나면 중복을 줄입니다.
자주 쓰는 작업은 템플릿으로 저장합니다.

가장 좋은 예시는 성공 사례가 아니라 실패를 고친 사례입니다. 모델이 자주 틀리는 입력을 예시로 넣으면 프롬프트가 빠르게 안정됩니다.

체크리스트

입력/출력 예시가 최소 3개 있는가
대표 사례, 경계 사례, 예외 사례가 섞여 있는가
모든 출력 형식이 완전히 같은가
라벨 기준이 예시에서 드러나는가
실제 입력 직전에 "같은 기준으로"라고 연결했는가
예시가 너무 많아 토큰을 낭비하고 있지는 않은가
결과 검수 기준을 따로 남겼는가

주의할 점

퓨샷은 기준을 심는 기술이지 사실 검증을 대신하는 기술은 아닙니다. 모델이 예시 패턴을 잘 따라도, 내용 자체가 틀릴 수 있습니다.

특히 의료, 금융, 법률처럼 책임이 큰 영역에서는 퓨샷으로 답변 형식을 안정화할 수는 있어도 최종 판단은 전문가 검토가 필요합니다.

또한 예시에 편향이 있으면 출력도 편향됩니다. 예시가 모두 긍정 사례라면 모델은 애매한 입력도 긍정으로 분류하려고 할 수 있습니다. 좋은 퓨샷은 다양한 예시를 보여줍니다.