LLM이 스스로 판단하고 행동하는 시대,
모델을 바꿔도 무너지지 않는 설계 원칙
기반 모델을 호출해 그럴듯한 AI 애플리케이션을 만드는 일은 이제 누구에게나 열려 있습니다. 하지만 이를 실제 서비스로 운영하려 할 때, 본격적인 문제가 시작됩니다. 모델이 지어낸 답이 고객에게 그대로 전달되고, 매번 달라지는 출력이 후속 파이프라인을 무너뜨리고, 에이전트가 엉뚱한 도구를 호출하는 순간, 프롬프트 수정만으로는 해결되지 않는 구조적 문제가 드러납니다. AI가 스스로 계획하고 판단하고 행동하는 시대일수록 그 행동을 떠받치는 시스템 설계의 격차가 서비스의 성패를 결정합니다.
이 책은 콘텐츠 제어, RAG 고도화, 추론 확장, 다중 에이전트 협업, 비용·지연시간 최적화, 안전 가드레일까지 7개 영역을 관통하는 32가지 설계 패턴을 담았습니다. 각 패턴은 문제 정의, 해법, 트레이드오프, 예제 코드로 구성되어 있으며 특정 모델이나 프레임워크에 종속되지 않습니다. 기술 스택이 교체되어도 유효한 설계 원칙을 손에 쥐고 싶다면 이 책이 가장 확실한 출발점이 될 것입니다.
주요 내용
- LLM의 태생적 한계를 극복하는 방법과 시스템 설계 우회법 알아보기
- 출력 콘텐츠의 특정 스타일, 어조, 데이터 형식 제어하기
- 비용, 지연시간과 같은 다양한 위험을 통제해 모델 효율성 극대화하기
- 스스로 계획하고 수정하며 외부 도구를 실행하는 자율 에이전트 구축하기
- 여러 패턴을 결합해 상용화 수준의 에이전틱 애플리케이션 완성하기
대상 독자
- 생성형 AI 기반 서비스를 설계·개발·운영하는 AI/백엔드 엔지니어
- 시스템 아키텍처와 품질을 책임지는 아키텍트나 기술 리더
- LLM과 사내 데이터를 연결해 업무 자동화를 구축하려는 데이터/ML 엔지니어
- AI 도입의 설계 방향을 판단해야 하는 PM이나 CTO