블로그 | 모하지?

프롬프트 엔지니어링은 한동안 과장되게 소비되기도 했지만, Spring AI 문서를 보면 꽤 현실적인 주제로 정리된다.

핵심은 멋진 문장을 만드는 재주가 아니라, 어떤 작업에 어떤 프롬프트 패턴이 잘 맞는지 분류하고 코드로 재현 가능하게 만드는 일이다.

Prompt Engineering Patterns 문서는 이 점에서 꽤 실용적이다. Zero-shot부터 Chain of Thought, Self-Consistency, Tree of Thoughts, 코드 프롬프팅까지 대표 기법을 예제와 함께 정리한다.

이 글에서는 그 문서를 기준으로, 실제 Spring AI 개발 관점에서 무엇을 먼저 이해하면 좋은지 요약해 본다.

프롬프트 엔지니어링을 “요령”보다 “패턴”으로 봐야 하는 이유

프롬프트 문제를 감각에만 맡기면 팀 개발이 어려워진다.

왜 이 문장이 더 잘 먹히는지 설명하기 어렵고
품질 회귀를 추적하기도 어렵고
코드 리뷰도 애매해진다

반대로 패턴으로 보면 훨씬 선명해진다.

지금 작업은 예시가 없어도 되는가
형식 통제가 필요한가
먼저 배경지식을 끌어내야 하는가
한 번 답변보다 다중 시도 집계가 필요한가

Spring AI 예제가 좋은 이유도 바로 여기에 있다. 패턴을 ChatClient 코드 형태로 옮길 수 있게 보여 주기 때문이다.

1) Zero-shot: 가장 가볍고, 여전히 제일 많이 쓰는 기본값

Zero-shot prompting은 예시를 주지 않고 바로 지시하는 방식이다.

예를 들어,

감성 분류
짧은 요약
제목 생성
간단한 번역

같은 작업에서는 여전히 가장 효율적인 기본값이다.

문서 예제에서도 감성 분류에 낮은 temperature와 짧은 최대 토큰을 함께 사용한다. 이 조합이 중요한 이유는, zero-shot은 자유도가 높아질수록 출력 흔들림도 커지기 때문이다.

즉 zero-shot은 단순하지만 아무렇게나 쓰는 방식이 아니라, 작업이 충분히 익숙한 문제인지 + 출력 자유도를 얼마나 줄일지를 함께 고려해야 한다.

2) One-shot / Few-shot: 형식과 경계 사례를 가르칠 때 강하다

문서의 피자 주문 JSON 예제는 few-shot이 왜 필요한지 잘 보여 준다.

모델이 단순한 분류는 알아서 해도,

특정 JSON 구조를 맞춰야 하거나
반반 피자처럼 애매한 입력이 있거나
출력 형식 실수가 치명적일 때

는 예시가 훨씬 큰 차이를 만든다.

few-shot의 장점은 단순히 “정답을 보여 준다”가 아니다.

어떤 형식을 기대하는지
어떤 세부를 뽑아야 하는지
예외 입력을 어떻게 해석해야 하는지

를 함께 학습시킨다.

다만 예시가 길어질수록 토큰 비용이 늘고, 관리도 번거로워진다. 그래서 few-shot은 무조건 많이 주는 게 아니라 가장 대표적인 예시 몇 개를 신중하게 고르는 작업에 가깝다.

3) System / Role / Contextual Prompting: 지시문을 한 문단으로 몰지 말라는 교훈

프롬프트에 문맥을 구성하는 방식 — 전역 규칙, 역할, 현재 문맥을 분리해 넣어야 프롬프트가 덜 무너지고 재사용이 쉬워진다.

문서에서 아주 실무적인 부분은 시스템 프롬프트, 역할 프롬프트, 컨텍스트 프롬프트를 분리해서 설명하는 대목이다.

이걸 하나의 긴 문장으로 섞어 쓰기 시작하면 금방 유지보수가 어려워진다.

System Prompting

전역 규칙, 출력 형식, 금지 사항, 응답 태도를 잡는 데 적합하다.

예:

항상 JSON으로 답하라
대문자 라벨만 반환하라
과도한 설명을 하지 마라

Role Prompting

전문가 페르소나나 표현 스타일을 부여할 때 좋다.

예:

여행 가이드처럼 답하라
기술 지원 엔지니어처럼 설명하라
유머러스한 톤으로 말하라

Contextual Prompting

현재 작업에만 필요한 배경 정보를 주입할 때 유리하다.

예:

지금 대상 독자는 80년대 게임 블로그 독자다
이 문서는 특정 산업 규제 환경을 전제로 한다

Spring AI의 param() 방식이 유용한 이유는, 이런 맥락을 코드에서 안전하게 주입하기 쉽기 때문이다.

핵심은 한 줄이다. 전역 규칙, 역할, 현재 문맥을 분리하면 프롬프트가 훨씬 덜 무너진다.

4) Step-back Prompting: 바로 답하지 말고 먼저 큰 그림을 꺼내게 하기

이 패턴은 생각보다 쓸모가 많다.

Step-back prompting은 복잡한 문제를 바로 풀게 하기보다, 먼저 관련 배경 개념이나 상위 원리를 끌어오게 만든다. 문서 예제에서는 게임 스토리라인을 만들기 전에 먼저 흥미로운 설정 요소를 추출한다.

실무에서 이 방식이 잘 맞는 경우는 이런 쪽이다.

전략 문서 초안
복잡한 아키텍처 설명
문제 원인 분석
글쓰기/기획 아이디어 확장

즉 최종 답을 곧바로 강요하는 대신, 한 번 추상화하고 나서 다시 구체화하는 2단계 흐름을 만드는 것이다.

Spring AI에서는 이 패턴을 별도 프레임워크가 아니라, ChatClient 두 번 호출로 명료하게 구현할 수 있다.

5) Chain of Thought: “단계별로 생각하라”의 힘과 한계

문서가 보여 주듯 Let's think step by step 같은 문구는 여전히 강력하다.

특히,

산술 문제
논리 추론
다단계 판단

에서 성능 향상 효과가 크다.

다만 실무에서는 두 가지를 같이 봐야 한다.

첫째, reasoning을 길게 풀수록 비용과 지연이 커질 수 있다. 둘째, 내부 추론을 전부 노출하는 UX가 항상 좋은 건 아니다.

그래서 CoT는 모든 답변에 붙이는 만능 주문보다, 복잡한 추론이 필요한 문제에 선택적으로 적용하는 패턴으로 보는 편이 좋다.

6) Self-Consistency: 한 번의 대답보다, 여러 번 돌려서 다수결을 보는 접근

이 패턴은 고비용이지만 꽤 현실적이다.

문서 예제는 동일한 이메일 분류를 여러 번 실행한 뒤 다수결로 최종 판단한다. 이 방식이 유용한 이유는 모델 출력이 확률적이기 때문이다.

즉 중요한 판단에서 한 번의 응답만 믿지 않고,

여러 번 생성하고
서로 다른 reasoning path를 얻고
최종 라벨을 집계하는

흐름을 만든다.

이건 특히 다음에 잘 맞는다.

중요도 분류
리스크 판단
고위험 자동화 전 단계 검토
평가 점수 집계

단점은 명확하다. 호출 수가 늘어나므로 비용과 지연이 함께 증가한다. 그래서 기본 패턴이라기보다, 정확도 우선 구간에서 쓰는 강화 패턴으로 보는 게 맞다.

7) Tree of Thoughts: 모든 문제에 쓰기보다, 탐색형 문제에만 신중하게

문서도 말하듯 ToT는 CoT보다 한 단계 더 복잡하다.

하나의 reasoning path만 따라가지 않고,

여러 후보를 만들고
평가하고
더 유망한 가지를 확장하는

탐색 구조다.

이건 체스, 전략, 일정 최적화, 대안 비교처럼 정답보다 탐색 과정이 중요한 문제에 더 잘 맞는다.

하지만 운영 관점에서는 구현 복잡도와 호출 비용이 빠르게 커진다. 그래서 대부분의 서비스에서는 ToT를 전면 적용하기보다,

중요한 고난도 시나리오에만 제한적으로 쓰거나
오케스트레이터-워커 패턴처럼 더 구조적인 워크플로로 바꿔 보는 편

이 현실적이다.

8) Automatic Prompt Engineering: 프롬프트도 실험 대상이라는 관점

이 패턴은 메타적이다.

모델에게 프롬프트 후보를 여러 개 생성하게 하고, 그중 더 나은 것을 평가하게 만든다. 결국 “프롬프트를 사람 감으로만 다듬지 말고, 후보군과 평가 기준을 운영하자”는 생각에 가깝다.

실무에서 이 접근이 유용한 경우는,

대량 변형 문구가 필요한 챗봇 학습 데이터 생성
분류/추출 프롬프트 튜닝
특정 태스크용 지시문 최적화

같은 곳이다.

즉 APE는 마법의 자동 최적화라기보다, 프롬프트도 측정 가능한 실험 대상으로 다루는 태도라고 보는 편이 맞다.

9) Code Prompting: 코드 태스크는 일반 글쓰기와 다르게 다뤄야 한다

Spring AI Chat API 구조 — 코드 태스크도 결국 메시지 구성과 호출 제약을 얼마나 명확히 주느냐에 따라 품질 차이가 커진다.

문서 마지막의 코드 프롬프팅도 꽤 중요하다.

코드 관련 작업은 일반 자연어 태스크와 다르게,

더 명확한 제약이 필요하고
출력 형식이 중요하며
낮은 temperature가 유리한 경우가 많다

는 특성이 있다.

문서 예제처럼 코드 생성, 코드 설명, 코드 번역을 나눠 보는 관점도 좋다. 실제 개발 환경에서는 이 세 가지가 서로 다른 품질 기준을 갖기 때문이다.

코드 생성: 정확성, 실행 가능성
코드 설명: 가독성, 교육적 설명력
코드 번역: 의미 보존, 문법 변환 정확도

즉 “코드도 잘 써 줘”보다, 어떤 코드 태스크인지 정확히 말해 주는 것이 더 중요하다.

결국 중요한 건 패턴 선택이다

이 문서를 읽고 얻는 가장 큰 교훈은 이것이다.

프롬프트 엔지니어링은 좋은 문장을 외우는 일이 아니라, 작업 유형에 맞는 패턴을 선택하는 일이다.

대략 이렇게 정리할 수 있다.

Zero-shot: 단순 태스크의 기본값
Few-shot: 형식 통제와 예외 처리
System / Role / Context: 지시 구조화
Step-back: 먼저 큰 그림을 끌어올 때
CoT: 다단계 추론
Self-Consistency: 더 높은 신뢰도 필요할 때
ToT: 탐색형 고난도 문제
APE: 프롬프트 자체 최적화
Code Prompting: 코드 전용 태스크 설계

마무리

Spring AI의 Prompt Engineering Patterns 문서는 프롬프트를 감각의 영역에만 두지 않고, 재현 가능한 코드 패턴으로 정리한다는 점에서 가치가 있다.

그래서 이 문서를 읽고 나면 프롬프트 설계가 조금 더 선명해진다.

언제 예시를 줘야 하는지
언제 역할을 분리해야 하는지
언제 한 번 더 생각하게 해야 하는지
언제 다중 호출로 신뢰도를 끌어올려야 하는지

결국 좋은 프롬프트는 멋진 문장보다, 작업에 맞는 패턴을 고르고, 그 패턴을 코드로 일관되게 운영하는 것에서 나온다.

Prompt Engineering Patterns를 코드 관점에서 읽는 법