본문으로 바로가기
태극기이 누리집은 대한민국 공식 전자정부 누리집입니다.
평면표지(2D 앞표지)
입체표지(3D 표지)
입체표지(3D 표지)
2D 뒤표지

7가지 프로젝트로 배우는 LLM AI 에이전트 개발

OpenAI, LangChain, LlamaIndex, MetaGPT 기초부터 실무까지 한 권으로 완성하는 인공지능 에이전트 개발


  • ISBN-13
    979-11-94587-20-0 (93000)
  • 출판사 / 임프린트
    주식회사 제이펍 / 주식회사 제이펍
  • 정가
    36,000 원 확정정가
  • 발행일
    2025-04-22
  • 출간상태
    출간
  • 저자
    황자(黄佳)
  • 번역
    김진호
  • 메인주제어
    인공지능
  • 추가주제어
    전문가시스템 / 지식기반시스템 , 자연언어 및 기계언어 , 기계학습 , 컴퓨터프로그래밍 / 소프트웨어공학 , 프로그래밍기법 , 소프트웨어엔지니어링 , 프로그래밍 및 스크립트언어 / 일반 , 웹프로그래밍
  • 키워드
    #인공지능 #전문가시스템 / 지식기반시스템 #자연언어 및 기계언어 #기계학습 #컴퓨터프로그래밍 / 소프트웨어공학 #프로그래밍기법 #소프트웨어엔지니어링 #프로그래밍 및 스크립트언어 / 일반 #웹프로그래밍
  • 도서유형
    종이책, 반양장/소프트커버
  • 대상연령
    모든 연령, 성인 일반 단행본
  • 도서상세정보
    188 * 245 mm, 436 Page

책소개

AI 에이전트 시대가 왔다 

 

에이전트는 자연어를 이해하고 그에 맞는 응답을 생성할 뿐만 아니라 특정 작업을 수행할 수 있는 인공지능이다. 단순한 콘텐츠 생성 도구를 넘어, 복잡한 업무를 매끄럽게 연결해주는 핵심적인 연결고리 역할을 한다. 이 책은 꽃 배달 서비스를 만들며 에이전트의 기술 프레임워크와 개발 도구, 실무 프로젝트 사례부터 최첨단 기술의 발전까지 포괄적으로 탐구한다. 또한, 7개의 강력한 에이전트를 직접 만들어보면서 에이전트의 설계와 구현을 상세히 분석하고, 에이전트 개발의 전망과 미래 트렌드까지 제시한다. GPT-4, OpenAI Assistants API, LangChain, LlamaIndex, MetaGPT와 같은 최첨단 기술을 활용하여 사무 자동화, 지능형 스케줄링, RAG 분야에서 에이전트가 수행할 수 있는 놀라운 역할을 확인할 수 있다. 에이전트의 놀라운 성능을 직접 확인하고, AI 시대의 무한한 가능성을 체감해보자.

목차

옮긴이 머리말 xi

추천의 글 xiii

베타리더 후기 xiv

추천사 xvii

시작하며 xix

이 책에 대하여 xxiii

 

 

CHAPTER 1 에이전트란 무엇이며, 왜 에이전트인가 1

1.1 상상력을 자극하는 강연: Life 3.0 2

1.2 그렇다면, 도대체 에이전트란 무엇인가? 6

1.3 에이전트의 두뇌: LLM의 범용 추론 능력 11

__인간의 뇌는 대단하다 12 

__LLM 이전의 에이전트 13

__LLM이 곧 에이전트의 두뇌다 14 

__기대의 고점과 실망의 저점 17

__지식, 기억, 이해, 표현, 추론, 성찰, 일반화, 자기 향상 20

__LLM의 추론 능력 기반의 인공지능 애플리케이션 구축 24

1.4 에이전트의 감지 능력: 언어 상호작용 능력과 멀티모들 처리 능력 26

__언어 상호작용 능력 26 

__멀티모들 처리 능력 26

__언어 상호작용 능력과 멀티모들 처리 능력의 결합 27

1.5 에이전트의 실행력: 언어 출력 능력과 도구 사용 능력 28

__언어 출력 능력 28 

__도구 사용 능력 29

__구체적 지능의 실현 30

1.6 에이전트가 각 산업에 미치는 효율성 향상 31

__자동화된 사무 업무 지원 33 

__고객 서비스 혁명 33

__개인화 추천 34 

__프로세스 자동화 및 자원 최적화 34

__의료 서비스의 변화 35

1.7 에이전트가 가져오는 새로운 비즈니스 모델과 변화 37

__가트너의 8대 주요 예측 38 

__AaaS 39 

__다중 에이전트 협업 41

__자기 진화형 인공지능 42 

__구체적 지능의 발전 44

1.8 요약 45

 

CHAPTER 2 LLM 기반의 에이전트 기술 기반 체계 47

2.1 에이전트의 네 가지 핵심 요소 47

2.2 에이전트의 계획 및 의사 결정 능력 51

2.3 에이전트의 다양한 기억 기제 53

2.4 에이전트의 핵심 기술: 도구 호출 54

2.5 에이전트의 추론 엔진: ReAct 기반 체계 57

__ReAct란 무엇인가? 57 

__ReAct 기반 체계를 이용한 간단한 에이전트 구현 61

__ReAct 기반 체계 기반의 프롬프트 65 

__LLM 인스턴스 생성 69

__검색 도구 정의 70 

__ReAct 에이전트 생성 71 

__ReAct 에이전트 실행 72

2.6 기타 에이전트 인지 기반 체계 76

__함수 호출 76 

__계획과 실행 76 

__자문자답 76 

__비판적 수정 77

__사고의 연쇄 77 

__사고의 나무 77

2.7 요약 78

 

CHAPTER 3 OpenAI API, LangChain, LlamaIndex 81

3.1 OpenAI API란 무엇인가? 83

__OpenAI라는 회사에 대해 이야기하다 83

__OpenAI API와 에이전트 개발 89

__OpenAI API를 이용한 대화 프로그램 예제 92

__OpenAI API를 이용한 이미지 생성 예제 101

__OpenAI API 사용 시 주의사항 103

3.2 LangChain이란 무엇인가? 106

__LangChain에 대해 이야기하다 107 

__LangChain의 여섯 가지 모듈 114

__LangChain과 에이전트 개발 115 

__LangSmith 사용 방법 117

3.3 LlamaIndex란 무엇인가? 120

__LlamaIndex에 대해 이야기하다 120

__LlamaIndex와 검색증강생성 기반의 인공지능 개발 121

__간단한 LlamaIndex 개발 예제 126

3.4 요약 130

 

CHAPTER 4 에이전트 1: 자동화된 사무 구현 — Assistants API와 DALL·E 3 모델을 이용한 프레젠테이션 제작 132

4.1 OpenAI의 도우미란 무엇인가? 134

4.2 코딩 없이 플레이그라운드에서 도우미 체험하기 136

4.3 Assistants API의 간단한 예제 142

__도우미 생성하기 143 

__대화 흐름 생성하기 149 

__메시지 추가하기 153

__도우미 실행하기 157 

__응답 표시하기 163

4.4 간단한 가상의 프레젠테이션 작성하기 167

__데이터 수집과 정리하기 168 

__OpenAI 도우미 생성하기 169

__자동으로 데이터 분석 차트 생성하기 172 

__자동으로 데이터 통찰 생성하기 179

__자동으로 페이지 제목 생성하기 182

__DALL·E 3 모델을 사용해 프레젠테이션 첫 페이지 이미지 만들기 183

__자동으로 프레젠테이션 생성하기 185

4.5 요약 191

 

CHAPTER 5 에이전트 2: 다기능 선택 엔진 — 함수 호출 기능 193

5.1 OpenAI의 함수 195

__함수 도구란 무엇인가? 195 

__함수 도구의 설명이 중요한 이유 196

__함수 도구 정의 예시의 의미 198 

__함수 호출이란 무엇인가 199

5.2 플레이그라운드에서 함수 정의하기 201

5.3 Assistants API를 이용한 함수 호출 구현 205

__함수 도구를 사용할 수 있는 도우미 생성하기 207

__함수 호출 없이 직접 도우미 실행하기 210

__실행 세션이 조치 필요 상태일 때 순환 종료하기 219

__도우미가 반환한 속성 정보 획득하기 221

__도우미의 반환 정보를 통해 함수 호출하기 223

__결과를 제출하고 작업 완료하기 225

5.4 ChatCompletion API를 이용한 도구 호출 구현 231

__대화 초기화 및 사용 가능한 함수 정의 232

__첫 번째 LLM 호출: 대화 내용과 도구 정의 전달 후 응답받기 233

__모델이 선택한 도구 호출과 새 메시지 작성하기 237

__두 번째 LLM 호출: 최종 응답 받기 241

5.5 요약 244

 

CHAPTER 6 에이전트 3: 추론과 행동의 협업 — LangChain의 ReAct 기반 체계를 이용한 자동 가격 설정 구현 246

6.1 ReAct 기반 체계 복습 247

6.2 LangChain에서 ReAct 에이전트 구현하기 251

6.3 LangChain의 도구와 도구 모음 253

6.4 꽃 가격을 책정하는 ReAct 에이전트 256

6.5 AgentExecutor의 실행 기제 심층 탐구 263

__AgentExecutor에 중단점 설정하기 263

__첫 번째 사고: 모델이 검색하기로 결정하다 267

__첫 번째 행동: 도구를 이용해 검색을 실행하다 272

__두 번째 사고: 모델이 계산하기로 결정하다 276

__두 번째 행동: 도구를 이용해 계산을 실행하다 277

__세 번째 사고: 모델이 작업을 완료하다 279

6.6 요약 280

 

CHAPTER 7 에이전트 4: 계획과 실행의 분리 — LangChain의 계획과 실행 에이전트를 활용한 스마트 스케줄러 작성 282

7.1 계획과 해결 전략의 제안 284

7.2 LangChain의 계획과 실행 에이전트 290

7.3 계획과 실행 에이전트를 이용한 물류 관리 구현 291

__자동 재고 배분을 위한 도구를 에이전트에 정의하기 291

__계획과 실행 에이전트 생성 및 해결 불가능 과제의 해결 시도 294

__요청을 구체화하여 에이전트가 과제를 완료하게 하기 303

7.4 단일 에이전트에서 다중 에이전트로 309

7.5 요약 309

 

CHAPTER 8 에이전트 5: 지식의 추출과 통합 — LlamaIndex를 이용한 검색증강생성 구현 311

8.1 검색증강생성이란 무엇인가? 313

__프롬프트 엔지니어링, 검색증강생성, 파인튜닝 314

__기술적 관점에서 본 검색 부분의 파이프라인 316

__사용자 관점에서 본 검색증강생성 과정 317

8.2 검색증강생성과 에이전트 319

8.3 ReAct 검색증강생성 에이전트를 이용해 재무 보고서 검색하기 321

__전자상거래 업체의 재무 보고서 파일 적재하기 321

__재무 보고서 데이터를 벡터 데이터로 변환하기 322

__요청 엔진과 도구 구축하기 324

__텍스트 생성 엔진인 LLM 설정하기 325

__재무 정보 검색을 위한 에이전트 생성하기 325

8.4 요약 327

 

CHAPTER 9 에이전트 6: 깃허브의 인기 에이전트 탐색 — AutoGPT, BabyAGI, CAMEL 329

9.1 AutoGPT 330

__AutoGPT 개요 330 

__AutoGPT 실습 332

9.2 BabyAGI 338

__BabyAGI 개요 338 

__BabyAGI 실습 341

9.3 CAMEL 356

__CAMEL 개요 356 

__CAMEL 논문의 주식 거래 시나리오 358 

__CAMEL 실습 364

9.4 요약 373

 

CHAPTER 10 에이전트 7: 다중 에이전트 기반 체계 — AutoGen, MetaGPT 375

10.1 AutoGen 376

__AutoGen 소개 377 

__AutoGen 실습 379

10.2 MetaGPT 386

__MetaGPT 소개 386 

__MetaGPT 실습 388

10.3 요약 395

 

APPENDIX A 다음 세대 에이전트의 탄생지: 학술 논문에서 찾아낸 새로운 아이디어 397

A.1 두 편의 고품질 에이전트 종합 논문 398

A.2 논문 추천: 에이전트 자율 학습, 다중 에이전트 협력, 에이전트 신뢰성 평가, 에지 시스템 배포, 체화 지능 구현 401

A.3 요약 402

 

마치며 404

찾아보기 407

본문인용

에이전트는 ReAct 기반 체계를 통해 동적인 의사 결정 능력을 얻게 됩니다. 에이전트가 내부 지식만으로 해결할 수 없는 문제에 직면했을 때는 검색을 실시하거나 도구를 호출하여 자신의 지식을 확장합니다. 또 이 외에도 다양한 도구의 유연성을 활용하여 여러 데이터를 조정하며 전환하고 최종적으로 결정을 내리기 위한 데이터를 얻습니다. 에이전트는 각 단계를 수행한 후 결과를 관찰하고, 새로운 정보를 다음 의사 결정 과정에 반영하며, 이를 통해 뛰어난 학습 능력과 적응력을 보여줍니다. (79쪽)

 

LlamaIndex의 전략은 LangChain과는 약간 다릅니다. LlamaIndex는 그렇게 ‘크고 전면적’인 것은 아니지만, 인공지능 기반의 검색증강생성 기술 개발과 멀티테넌트 검색증강생성(multi-tenant RAG) 시스템 구축에 특히 주력하고 있습니다. LlamaIndex 기반의 기업 설루션은 기술과 보안 장벽을 제거하고 기업의 데이터 활용과 서비스 역량을 강화하는 데 중점을 둡니다. LlamaIndex의 관련 작업은 기술 개발뿐만 아니라 이러한 기술을 실제 비즈니스에 적용해 업무 효율성과 고객 경험을 향상하는 데도 중점을 두고 있습니다. (120쪽)

 

물론 이는 LangChain이 너무 방대하고 전면적으로 확장되다 보니 그 여파로 오히려 방향을 잡기 어려워진 것도 이유일 수 있습니다. 특히 세부사항이 부족한 경우가 많은데, LangChain의 깃허브 페이지를 보면 해결되지 않은 이슈(opened issue)가 수천 개에 이르는 것을 알 수 있습니다. 따라서 문서 검색과 생성 강화에만 집중하고자 한다면 ‘작고 아름다운’ LlamaIndex를 선택하는 것이 더 나은 선택일 수도 있습니다. (121쪽)

 

ReAct 템플릿을 위와 같이 약간 수정했고, 이를 통해 GPT 모델의 비영어권 언어 이해 능력을 확인할 수 있었습니다. 그리고 이렇게 수정해도 가끔 영어로 뽐내고 싶어 할 때가 있기 때문에, 그럴 때는 프롬프트에서 답변을 한국어로 하도록 강조할 수 있습니다. 이 결과를 통해 알 수 있듯이, LangChain 안에서 에이전트는 자동으로 완벽한 사고와 행동의 흐름을 형성했으며, 그에 따라 올바른 답변을 제공했습니다. (262쪽)

 

계획과 해결 인지 기반 체계는 LLM이 두 개의 단계를 거쳐 문제를 해결하도록 요구합니다. 먼저 문제 해결을 위한 계획을 전부 세우고, 그 계획을 기반으로 단계별 행동 방안을 생성한 다음, 생성된 방안을 실행하여 답을 찾는 방식입니다. 다시 말해 해결 방안의 각 단계를 먼저 전부 계획하고 나서 계획된 단계를 실행하는 방식입니다. 계획과 해결 인지 기반 체계는 문제를 작은 하위 작업으로 나누고 계획에 따라 이를 해결합니다. (288쪽)

서평

미래를 바꿀 AI 에이전트의 세계로

최근 AI 기술의 발전과 함께 AI 에이전트(AI Agent)는 단순한 챗봇을 넘어 다양한 업무를 자동화하고 최적화하는 강력한 도구로 자리 잡고 있다. 기업들은 AI 에이전트를 활용하여 사무 자동화, 고객 서비스, 개인화 추천, 프로세스 자동화, 자원 최적화, 의료 서비스 등 다양한 분야에서 혁신을 이룰 것이다. 개발자들에게 AI 에이전트 기술을 배우고 활용하는 것은 필수적인 역량이 되고 있다.

이 책은 꽃 배달 서비스를 돕는 7가지 AI 에이전트 프로젝트 예제를 통해 AI 에이전트 개발의 핵심 개념과 기술을 쉽게 익힐 수 있도록 구성되어 있다. 단순한 이론 설명을 넘어, 실제 구축 과정에서 발생하는 문제 해결법과 최적화 전략을 상세히 다룬다. 

AI 에이전트를 활용한 자동화 기술을 배우고 싶은 개발자부터, 인공지능의 최신 트렌드를 파악하고 싶은 연구자 및 기획자까지 모두에게 유용한 실전 가이드가 될 것이다. 이 책을 통해 AI 에이전트의 가능성을 직접 체험하고, 미래 AI 기술의 중심에서 성장할 준비를 해보자!

 

대상 독자

  • AI 및 소프트웨어 개발자: AI 에이전트 개발을 실습하며 실전 감각을 키우고 싶은 개발자
  • 데이터 과학자 및 연구원: LLM 및 RAG 기술을 활용한 지능형 검색 및 데이터 활용 방법을 배우고 싶은 전문가
  • IT 기획자 및 스타트업 창업자: 최신 AI 기술을 서비스에 적용하고 싶은 기획자 및 스타트업 관계자
  • AI 에이전트에 관심 있는 일반 독자: LLM을 활용한 AI 기술이 실제 어떻게 적용되는지 체험하고 싶은 사람

 

7가지 프로젝트 사례

  • 에이전트 1: Assistants API와 DALL·E 3 모델을 이용해 자동으로 프레젠테이션 생성하기
  • 에이전트 2: OpenAI Assistants API를 이용해 에이전트가 OpenAI 함수를 호출하게 하기
  • 에이전트 3: LangChain의 ReAct 기반 체계를 이용해 가격 생성하기
  • 에이전트 4: LangChain의 계획과 실행 에이전트를 활용해 물류 관리 구현하기
  • 에이전트 5: LlamaIndex를 이용해 검색증강생성을 구현하고 재무 보고서 검색 및 분석하기
  • 에이전트 6: BabyAGI 다단계 작업 관리 에이전트로 제품 보관 전략 수립하기
  • 에이전트 7: AutoGen, MetaGPT로 주문 접수부터 비용 관리까지 마치는 다중 에이전트 시스템 구축하기

저자소개

저자 : 황자(黄佳)
싱가포르 과학기술연구청 인공지능 연구원.
자연어 처리, LLM, 의료 및 핀테크 분야 등 다양한 인공지능 프로젝트를 수행해왔다. 머신러닝 관련 베스트셀러를 여러 권 집필했으며, 인공지능, LLM 관련 강의를 하고 GeekTime, CSDN 등에서 칼럼을 연재 중이다. 항상 호기심을 잃지 않고 변화를 적극적으로 받아들이며 지속적으로 학습하는 것을 즐긴다. 인공지능의 ‘혜안’과 ‘주의력’을 통해 세상을 관찰하며, 쉽고 재미있는 방식으로 지식을 공유하여 사람들과 순수한 즐거움을 나누고자 한다.
번역 : 김진호
26년 차 소프트웨어 개발자로 SK텔레콤에서 싸이월드, 티맵 등의 모바일 설루션을 개발했으며, 사우디아라비아 등 중동의 여러 국가, 인도네시아, 멕시코에서 서버부터 단말기에 이르는 은행 결제 시스템을 개발해왔다. 이후 K-POP, 블록체인, 애자일 솔루션 등 다양한 분야의 업체에서 CTO와 개발 이사를 역임했으며, 지금은 헬스케어 플랫폼 업체에서 CTO로서 새로운 플랫폼을 개발하고 있다. 저서로는 《실전 안드로이드 프로그래밍》, 《갤럭시 S & 안드로이드폰 완전정복》, 《갤럭시 S 안드로이드폰 어플 활용 백서》, 《입문자를 위한 Windows CE Programming》 등이 있으며, 번역서로는 《디자인 패턴의 아름다움》, 《컴퓨터 밑바닥의 비밀》, 《파이썬 코딩의 기술 51》, 《소프트웨어 개발에 ChatGPT 사용하기》, 《프롬프트 엔지니어링의 비밀》이 있다.
상단으로 이동
  • (54866) 전북특별자치도 전주시 덕진구 중동로 63