본문으로 바로가기
태극기이 누리집은 대한민국 공식 전자정부 누리집입니다.
평면표지(2D 앞표지)
입체표지(3D 표지)
2D 뒤표지

에이전트 시대의 AI 시스템 설계

RAG, 최적화, 가드레일로 완성하는 32가지 프로덕션 패턴


  • ISBN-13
    979-11-7579-049-0 (93000)
  • 출판사 / 임프린트
    한빛앤(주) / 한빛미디어
  • 정가
    42,000 원 확정정가
  • 발행일
    2026-04-27
  • 출간상태
    출간
  • 저자
    하네스 하프케 , 발리아파 락슈마난
  • 번역
    류광
  • 메인주제어
    인공지능
  • 추가주제어
    기계학습 , 시스템분석 및 디자인
  • 키워드
    #AI 시스템 #RAG #에이전트 #에이전틱AI #디자인 패턴 #인공지능 #기계학습 #시스템분석 및 디자인
  • 도서유형
    종이책, 무선제본
  • 대상연령
    모든 연령, 성인 일반 단행본
  • 도서상세정보
    183 * 235 mm, 592 Page

책소개

LLM이 스스로 판단하고 행동하는 시대,

모델을 바꿔도 무너지지 않는 설계 원칙

 

기반 모델을 호출해 그럴듯한 AI 애플리케이션을 만드는 일은 이제 누구에게나 열려 있습니다. 하지만 이를 실제 서비스로 운영하려 할 때, 본격적인 문제가 시작됩니다. 모델이 지어낸 답이 고객에게 그대로 전달되고, 매번 달라지는 출력이 후속 파이프라인을 무너뜨리고, 에이전트가 엉뚱한 도구를 호출하는 순간, 프롬프트 수정만으로는 해결되지 않는 구조적 문제가 드러납니다. AI가 스스로 계획하고 판단하고 행동하는 시대일수록 그 행동을 떠받치는 시스템 설계의 격차가 서비스의 성패를 결정합니다.

 

이 책은 콘텐츠 제어, RAG 고도화, 추론 확장, 다중 에이전트 협업, 비용·지연시간 최적화, 안전 가드레일까지 7개 영역을 관통하는 32가지 설계 패턴을 담았습니다. 각 패턴은 문제 정의, 해법, 트레이드오프, 예제 코드로 구성되어 있으며 특정 모델이나 프레임워크에 종속되지 않습니다. 기술 스택이 교체되어도 유효한 설계 원칙을 손에 쥐고 싶다면 이 책이 가장 확실한 출발점이 될 것입니다.

 

주요 내용

  • LLM의 태생적 한계를 극복하는 방법과 시스템 설계 우회법 알아보기
  • 출력 콘텐츠의 특정 스타일, 어조, 데이터 형식 제어하기
  • 비용, 지연시간과 같은 다양한 위험을 통제해 모델 효율성 극대화하기
  • 스스로 계획하고 수정하며 외부 도구를 실행하는 자율 에이전트 구축하기
  • 여러 패턴을 결합해 상용화 수준의 에이전틱 애플리케이션 완성하기

 

대상 독자

  • 생성형 AI 기반 서비스를 설계·개발·운영하는 AI/백엔드 엔지니어
  • 시스템 아키텍처와 품질을 책임지는 아키텍트나 기술 리더
  • LLM과 사내 데이터를 연결해 업무 자동화를 구축하려는 데이터/ML 엔지니어
  • AI 도입의 설계 방향을 판단해야 하는 PM이나 CTO

목차

CHAPTER 1 서론

_1.1 생성형 AI 설계 패턴

_1.2 기초 모델에 기반한 애플리케이션 구축

_1.3 에이전트형 AI

_1.4 세밀한 제어

_1.5 컨텍스트 내 학습

_1.6 사후훈련

_1.7 이 책의 구성

 

CHAPTER 2 콘텐츠 스타일의 제어

_2.1 패턴 1: 로짓 마스킹

_2.2 패턴 2: 문법

_2.3 패턴 3: 스타일 전이

_2.4 패턴 4: 역중립화

_2.5 패턴 5: 콘텐츠 최적화

_2.6 요약

 

CHAPTER 3 지식 추가: 기본

_3.1 패턴 6: 기본 RAG

_3.2 패턴 7: 의미 기반 색인화

_3.3 패턴 8: 대규모 색인화

_3.4 요약

 

CHAPTER 4 지식 추가: 고급

_4.1 패턴 9: 색인 인식 검색

_4.2 패턴 10: 노드 후처리

_4.3 패턴 11: 신뢰할 수 있는 생성

_4.4 패턴 12: 심층 탐색

_4.5 요약

 

CHAPTER 5 모델 능력 확장

_5.1 LLM 추론의 한계

_5.2 패턴 13: 사고 연쇄(CoT)

_5.3 패턴 14: 사고 트리(ToT)

_5.4 패턴 15: 어댑터 조정

_5.5 패턴 16: 지시사항 진화

_5.6 요약

 

CHAPTER 6 신뢰성 개선

_6.1 패턴 17: 심판형 LLM

_6.2 패턴 18: 성찰

_6.3 패턴 19: 의존성 주입

_6.4 패턴 20: 프롬프트 최적화

_6.5 요약

 

CHAPTER 7 에이전트의 행동 능력 활성화

_7.1 패턴 21: 도구 호출

_7.2 패턴 22: 코드 실행

_7.3 패턴 23: 다중 에이전트 협업

_7.4 요약

 

CHAPTER 8 제약 조건 해결

_8.1 패턴 24: 소규모 언어 모델

_8.2 패턴 25: 프롬프트 캐싱

_8.3 패턴 26: 인퍼런스 최적화

_8.4 패턴 27: 성능 저하 테스트

_8.5 패턴 28: 장기 기억

_8.6 요약

 

CHAPTER 9 안전장치 설정

_9.1 패턴 29: 템플릿 생성

_9.2 패턴 30: 조립 후 재구성

_9.3 패턴 31: 자체점검

_9.4 패턴 32: 가드레일

_9.5 요약

 

CHAPTER 10 조합 가능한 에이전트형 작업흐름

_10.1 에이전트형 작업흐름

_10.2 요약

 

본문인용

-

서평

-

저자소개

저자 : 하네스 하프케
AI 기반 핀테크 스타트업인 디지츠(Digits)의 수석 머신러닝 엔지니어로서 금융 애플리케이션용 머신러닝 시스템을 구축했다. 머신러닝 분야 구글 개발자 전문가(GDE)이며, 구글 개발자 자문 위원회에서 활동한다. 또한 『살아 움직이는 머신러닝 파이프라인 설계』(한빛미디어, 2021)와 『파이썬으로 배우는 자연어 처리 인 액션』(제이펍, 2020)을 포함해 여러 권의 머신러닝 관련 도서를 공동 저술했다.
저자 : 발리아파 락슈마난
금융 분야의 심화 도메인 AI 에이전트를 구축하는 스타트업 오빈 AI의 공동 창업자이자 CTO다. 그전에는 구글에서 AI 솔루션 부문 디렉터로, 미국 해양대기청(NOAA)에서 머신러닝 연구원으로 일했다. 다수의 오라일리 도서를 저술했으며, 기상 이변 예측 분야에 머신러닝을 도입한 선구적인 공로를 인정받아 미국기상학회 펠로로 선출되었다.
번역 : 류광
도널드 커누스 교수의 『컴퓨터 프로그래밍의 예술』 시리즈를 비롯해 다양한 IT 전문서를 번역한 전문 번역가이다. 생성형 AI 관련 번역서로는 『마스터링 트랜스포머』, 『실전! RAG 기반 생성형 AI 개발』, 『LLM 인 프로덕션』, 『AI 에이전트 인 액션』, 『스프링 AI 인 액션』(이상 위키북스), 『그림으로 배우는 생성형 AI』(한빛미디어, 2026) 등이 있다. 개인 웹사이트 류광의 번역 이야기(https://occamsrazr.net)와 IT 및 게임 개발 정보 공유 사이트 GpgStudy(https://gpgstudy.com)를 운영한다.
상단으로 이동
  • (54866) 전북특별자치도 전주시 덕진구 중동로 63