복사가 완료되었습니다.

테디노트의 랭체인을 활용한 RAG 비법노트 [기본편]

8단계 RAG 파이프라인으로 LLM 성능을 끌어올리는 RAG 기본부터 실제 챗봇 제작까지

ISBN-13

979-11-94084-16-7 (93000)
출판사 / 임프린트

리코멘드 / 리코멘드
정가

34,000 원 확정정가
발행일

2025-05-30
출간상태

출간
저자

이경록
번역

-
메인주제어

인공지능
추가주제어

-
키워드

#인공지능 #RAG #랭체인 #LangChain #LLM #테디노트 #테디노트 RAG #RAG 비법노트 #RAG 웹 애플리케이션 #RAG 웹 앱 #패스트캠퍼스 RAG #챗봇 개발 #랭체인 입문서 #LangChain 실습 #LangChain 프로젝트 #LLM 모델 비교 #LCEL #검색 증강 생성 #리트리버 #ChatGPT #임베딩 모델 #프롬프트 엔지니어링 #OpenAI 연동 #챗봇 제작 가이드 #Stramlit #LLM 애플리케이션 개발 #인공지능 개발 입문 #테디노트 파이썬 #생성형 AI #생성형 AI 활용 #랭체인 파이썬 #Ollama #Deepseek #Upstage #Hugging Face #LangSmith #이메일 자동화 챗봇 #PDF 문서 분석 #대화형 AI #인공지능 비즈니스 #AI 프로젝트 #프롬프트 메이커
도서유형

종이책, 무선제본
대상연령

모든 연령, 성인 일반 단행본
도서상세정보

188 * 257 mm, 544 Page

책소개
목차
본문인용
서평
저자소개

책소개

★ 8단계 RAG 파이프라인으로 LLM의 성능을 50점에서 90점으로 끌어올리는 RAG 시스템!

ChatGPT와 같은 LLM은 다양한 업무에 활용되지만, 최신 정보나 특정 문서 내용을 정확히 반영하지 못하는 한계가 있다. 이를 극복하는 대안이 RAG(검색 증강 생성) 기술이다. 이 책은 LangChain을 활용한 RAG 시스템을 ‘문서 로드 → 텍스트 분할 → 임베딩 → 벡터 저장 → 리트리버 검색 → 프롬프트 생성 → LLM 응답 생성 → 체인 구성’의 8단계로 정리하고 각 단계를 하나하나 실습하며 익힌다. 이 과정에서 LCEL 문법, 프롬프트 설계, 출력 포맷 처리법을 배우며, OpenAI, Hugging Face, Upstage, Ollama 등 다양한 모델과 연결하는 방법도 익힐 수 있다. 또한 Streamlit을 활용해 문서 검색, 이메일 자동화, 보고서 작성 챗봇, 멀티모달 챗봇 등 실무에 적용 가능한 다양한 웹 애플리케이션을 어렵지 않게 직접 제작할 수 있다.

CHAPTER 04 LangChain 시작하기
01 ChatOpenAI 주요 매개변수와 출력
02 LangSmith로 GPT 추론 내용 추적하기
03 멀티모달 모델로 이미지를 인식하여 답변 출력하기
04 프롬프트 템플릿 활용하기
05 LCEL로 체인 생성하기
06 출력 파서를 체인에 연결하기
07 batch() 함수로 일괄 처리하기
08 비동기 호출 방법
09 Runnable로 병렬 체인 구성하기
10 값을 전달해 주는 RunnablePassthrough
11 병렬로 Runnable을 실행하는 RunnableParallel
12 함수를 실행하는 RunnableLambda와 itemgetter

PART 02 프롬프트와 출력 파서

CHAPTER 05 프롬프트
01 프롬프트 템플릿 만들기
02 부분 변수 활용하기
03 YAML 파일로부터 프롬프트 템플릿 로드하기
04 ChatPromptTemplate
05 MessagesPlaceholder
06 퓨샷 프롬프트
07 예제 선택기
08 FewShotChatMessagePromptTemplate
09 목적에 맞는 예제 선택기
10 LangChain Hub에서 프롬프트 공유하기

CHAPTER 06 출력 파서
01 PydanticOutputParser
02 with_structured_output() 바인딩
03 LangSmith에서 출력 파서의 흐름 확인하기
04 쉼표로 구분된 리스트 출력 파서
05 구조화된 출력 파서
06 JSON 형식 출력 파서
07 Pandas 데이터프레임 출력 파서
08 날짜 형식 출력 파서
09 열거형 출력 파서

PART 03 모델과 메모리

CHAPTER 07 모델
01 RAG에서 LLM의 역할과 모델의 종류
02 다양한 LLM 활용 방법과 API 키 가져오기
03 LLM 답변 캐싱하기
04 직렬화와 역직렬화로 모델 저장 및 로드하기
05 GPT 모델의 토큰 사용량 확인하기
06 Google Generative AI 모델
07 Hugging Face Inference API 활용하기
08 Dedicated Inference Endpoint로 원격 호스팅하기
09 Hugging Face 로컬 모델 다운로드 받아 추론하기
10 Ollama 설치 및 Modelfile 설정하기
11 Ollama 모델 생성하고 ChatOllama 활용하기
12 GPT4All로 로컬 모델 실행하기

CHAPTER 08 메모리
01 대화 버퍼 메모리
02 대화 버퍼 윈도우 메모리
03 대화 토큰 버퍼 메모리
04 대화 엔티티 메모리
05 대화 지식 그래프 메모리
06 대화 요약 메모리
07 벡터 스토어 검색 메모리
08 LCEL 체인에 메모리 추가하기
09 SQLite에 대화 내용 저장하기
10 휘발성 메모리로 일반 변수에 대화 내용 저장하기

PART 04 데이터 로드와 텍스트 분할

CHAPTER 09 문서 로더
01 문서 로더의 구조 이해하기
02 PDF 로더
03 HWP 로더
04 CSV 로더와 데이터프레임 로더
05 WebBaseLoader
06 DirectoryLoader
07 UpstageDocumentParseLoader
08 LlamaParse

CHAPTER 10 텍스트 분할
01 문자 단위로 분할하기
02 문자 단위로 재귀적으로 분할하기
03 토큰 단위로 분할하기
04 의미 단위로 분할하기
05 코드 분할하기
06 마크다운 헤더로 분할하기
07 HTML 헤더로 분할하기
08 JSON 단위로 분할하기

PART 05 벡터 스토어와 리트리버

CHAPTER 11 임베딩
01 OpenAIEmbeddings
02 CacheBackedEmbeddings
03 HuggingFaceEmbeddings
04 UpstageEmbeddings
05 OllamaEmbeddings

CHAPTER 12 벡터 스토어
01 Chroma
02 FAISS
03 Pinecone

CHAPTER 13 리트리버
01 벡터 스토어 기반 리트리버
02 문서 압축기
03 양방향 리트리버
04 긴 문맥 재정렬
05 부모 문서 리트리버
06 다중 쿼리 생성 리트리버
07 다중 벡터 스토어 리트리버
08 셀프 쿼리 리트리버
09 시간 가중 벡터 스토어 리트리버

PART 06 LangChain 실습

CHAPTER 14 Streamlit으로 ChatGPT 웹 앱 제작하기
01 기본적인 웹 앱 형태 만들기
02 웹 앱에 체인 생성하기
03 프롬프트 타입 선택 기능 추가하기

CHAPTER 15 이메일 업무 자동화 챗봇
01 이메일 내용으로부터 구조화된 정보 추출하기
02 SerpAPI를 정보 검색에 활용하기
03 구조화된 답변을 다음 체인의 입력으로 추가하기
04 이메일의 주요 정보 및 검색 정보 기반 요약 보고서 챗봇

CHAPTER 16 다양한 모델을 활용한 챗봇
01 별도의 파이썬 파일로 기능 분리하기
02 GPT 대신 Deepseek 모델 사용하기
03 Ollama 모델을 사용한 RAG
04 멀티모달 모델을 활용한 이미지 인식 기반 챗봇

CHAPTER 17 RAG 챗봇
01 PDF 문서 기반 질의응답 RAG 만들기
02 프롬프트를 개선해 주는 프롬프트 메이커
03 페이지 분할 후 파일 업로드 기능 추가하기
04 PDF 기반 QA 챗봇 만들기
05 LangSmith 추적, 다양한 LLM을 RAG에 적용하기
06 프롬프트에 출처 표시하고 표 기능 추가하기

에필로그

찾아보기

본문인용

“서울특별시에 사는 테디 아버지 이름이 뭐야?”

ChatGPT는 이러한 개인적인 질문을 받으면 굉장히 황당할 겁니다. 테디가 누구인지, 그의 아버지 이름이 뭔지 어떻게 알겠냐고요. 이런 경우 모른다고 답하거나 답변하는 과정에서 잘못된 정보를 생성(할루시네이션)할 가능성이 높습니다. 하지만 다음과 같은 가족관계증명서를 GPT에게 주면 어떻게 될까요? GPT는 자료를 참고해서 테디 아버지 이름은 ‘폴’이라고 정확한 답변을 제공할 수 있을 것입니다.

--- p.25

완전 파인 튜닝은 다소 전문적인 영역이기 때문에 개인이 수행하기에는 어려울 수 있습니다. PEFT 역시 파인 튜닝의 한 종류이지만, 충분한 시간과 노력을 들인다면 개인적으로 시도해 볼 수 있는 수준입니다.

RAG는 코드 작성이 필요 없는 프롬프트 엔지니어링과 비교해도 구현 난이도가 그리 높지 않은데, 앞으로 학습할 8단계의 세부 모듈을 플러그인처럼 교체하는 방식으로 구현할 수 있기 때문입니다.

--- p.29

ChatGPT는 자체 RAG 시스템을 통해 답변을 제공하지만, 더 나은 답변을 위해 세부 알고리즘을 조정할 수 없다는 문제가 있습니다. 이제 우리는 LangChain을 통해 RAG의 모든 세부 프로세스를 한 땀 한 땀 구현할 것입니다. 한마디로 ‘튜닝’을 하는 것이죠. 우리가 원하는 형태의 답변을 얻을 때까지 각 과정을 투명하게 개선하고, 그 방법론을 체계적으로 정립해 놓으면 다양한 비즈니스 환경에서도 얼마든지 활용 가능한 수준의 성능에 도달할 수 있습니다.

--- p.33

가령 ‘인공지능 산업의 최신 동향’이라는 23페이지 분량의 보고서 PDF 파일을 업로드했다고 가정해 보겠습니다. 만약 프롬프트에서 이 파일의 모든 정보를 한 번에 참고한다면, 사용자가 질문을 할 때마다 23페이지나 되는 내용이 모두 프롬프트 입력으로 들어가 버립니다. 그러면 질문을 처리하는 비용이 비싸지기도 하거니와 GPT에 너무 많은 정보를 제공한 탓에 중요한 정보를 찾지 못할 수도 있습니다. 그래서 업로드한 정보에서 관련성 있는 정보만 골라서 리트리버(retriever, 검색기)에 전달하는 것이 효율적입니다. 이 과정이 RAG 프로세스의 사전 단계에 해당합니다.

--- p.34

LangChain과 RAG 관련 실습 코드는 지속적으로 업데이트되고 있습니다. LangChain의 빈번한 업데이트로 인해 기존 코드들이 레거시(더 이상 지원되지 않거나 지원이 종료된 코드)가 되는 경우가 많아, 패키지 업데이트 후에는 실행되지 않을 수 있습니다. 또한 LangChain이 지원하는 다양한 모델들도 업데이트에 따라 지원이 중단되거나, 새로운 모델이 아직 반영되지 않은 경우도 많습니다. 이에 대응하기 위해 이 책에서는 코드 변경을 추적하고 버전을 관리해 주는 시스템인 깃을 설치하여 항상 최신 코드로 실습할 수 있도록 하겠습니다.

--- p.43

서평

★ 8단계로 정리한 RAG 파이프라인을 손에 익히는 완성형 학습 과정

LLM과 RAG의 기본 개념을 이해하고, LangChain의 기본 사용법과 LCEL 체인 구성 문법을 익히는 체계적인 과정으로 이뤄져 있다. RAG 파이프라인 8단계(문서 로드 → 텍스트 분할 → 임베딩 → 벡터 저장 → 리트리버 검색 → 프롬프트 생성 → LLM 응답 생성 → 체인 구성)를 하나하나 실습하며, 각 단계에서 활용할 수 있는 다양한 모듈과 도구(PDF 로더, 여러 종류의 텍스트 분할기, OpenAI 및 Hugging Face 임베딩, 다양한 벡터 데이터베이스, 고급 리트리버 등)를 익힌다. 이 과정에서 선택 가능한 옵션과 특성, 차이점을 비교해 가며 기본기를 탄탄히 다진다.

★ 다양한 모델을 짧게, 빠르게, 반복해서 실전 감각 완성
책 전반에 걸쳐 LLM 모델(OpenAI, Hugging Face, Upstage, Ollama 등), 문서 로더(PDF, HWP, CSV, 웹 데이터), 텍스트 분할기, 벡터 스토어(Chroma, FAISS, Pinecone), 리트리버, 메모리 시스템 구축 과정을 반복해서 실습한다. 각 기능별로 짧은 코드 예제와 실행 결과를 통해 자연스럽게 손에 익히게 하며, 다양한 선택지를 실습하고 비교함으로써 자신의 프로젝트 목적에 맞는 최적의 모델과 기능을 빠르게 고를 수 있는 실전 감각을 기른다. 또한 최신 논문의 기술도 소개하며 실습에 직접 적용해 볼 수 있다.

★ 상황별 챗봇 프로젝트로 배우는 실전형 RAG 시스템 구축
Streamlit 프레임워크를 활용하여 다양한 상황별 RAG 프로젝트를 직접 만든다. 문서 기반 질문 응답 챗봇, 이메일 업무 자동화 챗봇, 멀티모달 입력을 지원하는 이미지 기반 챗봇, 다양한 오픈소스 모델을 조합한 고급 RAG 챗봇 등 실전 사례를 직접 구현해 본다.

▶추천사

“LangChain의 알파이자 오메가입니다. 이 시리즈로 배웠다면 더 배울 것이 없다고 할 정도로 상세히 많은 내용을 다루고 있습니다. 취업을 준비하든, 기업에서 AI 구현을 시작하든, AI의 실체를 알고 싶은 모든 분들에게 이 책을 권합니다 .”

_장동인_ KAIST 김재철 AI 대학원 책임교수 및 AIBB LAB 대표

“이 책은 ‘생존 키트’입니다. 특히 LangChain을 기반으로 한 RAG 전략과 현장 중심의 팁들은 빠르게 변화하는 개념을 단시간에 체득할 수 있을 뿐 아니라 바로 현업에서 실질적인 성과를 얻을 수 있습니다. 저자의 시간과 노하우를 오롯이 담아낸 이 노트를 너무 쉽게 얻게 되어 미안한 마음까지 듭니다.”

_강수진_ 더 프롬프트 컴퍼니 대표

▶코드 리뷰어들의 후기

“실습 중심으로 개념 학습은 물론, 실제 프로젝트에 곧바로 적용할 수 있는 실전형 가이드입니다. 특히 LangSmith와 같은 최신 도구까지 반영되어 있어 그 가치는 더 큽니다.”

_전창원_ LG CNS

“전공자가 아닌 제가 감히 리뷰를 해도 될지 고민했지만, 저와 비슷하게 다른 분야의 업무를 하면서 AI 분야 필요성을 느껴 배움을 시작하는 독자들에게 조금이라도 도움이 되고자 하는 마음으로 진행했습니다. 실습 중심의 구성과 친절한 설명 덕분에 누구든 부담 없이 시작할 수 있을 것입니다.”

_김무상_ 삼성전자

“『테디노트의 랭체인을 활용한 RAG 비법노트』는 LLM을 뛰어놀게 하는 아름다운 코드입니다. 리뷰를 거듭할수록 저자의 피와 땀이 얼마나 이 코드에 스며들었는지 느낄 수 있었습니다.”

_김정욱_ 브레인크루

▶이 책에 쏟아진 찬사

“시작이 어려웠던 모두에게 최고의 선택이 될 것입니다.”
_김재호_수원대학교 대학원 컴퓨터학과

“독보적 한국형 예시로 이해가 쏙쏙 되었고 빠르게 성장할 수 있었습니다.”
_박정기_JCH SYSTEMS / AI 선임 연구원 / n8n Korea 앰버서더

“복잡한 설명 없이 step by step 따라하기로! 정말 매력적입니다. 사실입니다.”
_신정호_입소스코리아 / 데이터사이언스

“책이 아니라 나침반을 사는 겁니다.”
_오주영_프리랜서

“LangChain 입문에 있어서 바이블 같은 책”
_정광원_주식회사 스튜디오엠 개발팀 팀장

“더 이상 랭체인이 무엇인지, 어떻게 개발해야 하는지 찾지 않게 되었습니다.”
_조영준_에스티이지

“코드를 따라 가다 보니 어느새 랭체인 마스터가 되었습니다.”
_허수영_윈드케어

▶이 책이 필요한 독자

RAG 기본 개념부터 실제 구현까지 체계적으로 배우고자 하는 입문자들
랭체인 프레임워크를 활용하여 RAG 시스템을 구축하려는 개발자들
LLM의 한계를 극복하고 정확한 정보 검색과 응답 생성을 결합하려는 데이터 전문가들
기업이나 조직에서 문서 검색, 이메일 자동화, 보고서 작성 등 실제 업무를 AI에 적용하려는 실무자들
기초적인 파이썬 실력을 가진 비개발자지만 AI에 관심있는 사람들

▶ 이 책에서 다루는 내용

_PART 01 처음 만나는 LangChain

RAG의 기본 개념과 필요성을 이해하고, 환경 설정 방법, LLM 기본 용어, LangChain의 핵심 기능과 LCEL 문법을 학습한다. ChatOpenAI 설정, 멀티모달 모델, 체인 구성 등 LangChain의 기초를 다룬다.

_PART 02 프롬프트와 출력 파서

프롬프트 템플릿 생성, 부분 변수 활용, 퓨샷 프롬프트, 예제 선택기 등 다양한 프롬프트 기법과 PydanticOutputParser, JSON 파서, 데이터프레임 파서 등 출력 형식을 제어하는 방법을 배운다.

_PART 03 모델과 메모리

다양한 LLM 모델(OpenAI, Google, Hugging Face, Ollama 등) 활용법과 대화 버퍼, 토큰 버퍼, 요약 메모리, 벡터 스토어 검색 메모리 등 대화 내용을 기억하는 메모리 시스템 구축법을 다룬다.

_PART 04 데이터 로드와 텍스트 분할

PDF, HWP, CSV 등 다양한 문서 로더와 문자 단위, 토큰 단위, 의미 단위, 코드, 마크다운, HTML, JSON 등 다양한 방식의 텍스트 분할 방법을 학습한다.

_PART 05 벡터 스토어와 리트리버

OpenAI, HuggingFace 등 임베딩 모델과 Chroma, FAISS, Pinecone 등 벡터 스토어, 다양한 리트리버(문서 압축기, 앙상블, 다중 쿼리 생성, 셀프 쿼리 등) 활용법을 배운다.

_PART 06 LangChain 실습

Streamlit으로 ChatGPT 웹 앱, 이메일 자동화 챗봇, 다양한 모델 활용 챗봇, PDF 기반 RAG 챗봇 등 실제 프로젝트를 구현하며 앞서 배운 기술을 종합적으로 적용한다.

저자소개

저자 : 이경록
삼성전자 무선사업부에서 소프트웨어 엔지니어로 출발했다. 2018년 AI 교육·개발 스타트업 브레인크루를 창업하며 현장 개발에 뛰어들었고, 데이터 분석, 머신러닝, 딥러닝 공부를 했던 것을 기반으로 생성형 AI 시대를 맞아 기술과 삶을 잇는 실전 개발을 끊임없이 하고 있다. 특히 2023년부터는 LLM·RAG 애플리케이션을 제작하며 〈랭체인 한국어 튜토리얼〉을 공개해 LangChain·LangGraph 생태계를 국내에 확산시켰고, 지금은 기업과 대학을 오가며 강연과 컨설팅을 통해 더 많은 학습자와 조직이 AI를 손에 쥘 수 있도록 돕고 있다.
개발을 사랑하고 사람들과 소통하는 것을 즐기는 천직 개발자다. 또한 지식 공유의 즐거움을 원동력 삼아 LLM 애플리케이션의 최전선에서 ‘쉬운 기술 설명’을 전파하는 데 누구보다 진심이다. 특히 이 믿음으로 지식 공유 플랫폼 ‘테디노트’ 블로그와 유튜브 채널을 운영한다. 2025년 4월 현재 유튜브 구독자 4.2만 명, GitHub 튜토리얼 1,630개와 약 1,500명의 팔로워를 기록하며 입문자에게 친숙한 언어로 AI 개념과 최신 동향을 전하고 있다.

대표 저서
- 일잘러의 비밀, 챗GPT와 GPTs로 나만의 AI 챗봇 만들기(2025, 한빛미디어)
- 파이썬 딥러닝 텐서플로 (2021, 정보문화사)

강의 채널
패스트캠퍼스 온라인 https://fastcampus.co.kr/data_online_teddy
최신 자료 공유 공간 https://linktr.ee/teddynote

테디노트의 랭체인을 활용한 RAG 비법노트 [기본편]

8단계 RAG 파이프라인으로 LLM 성능을 끌어올리는 RAG 기본부터 실제 챗봇 제작까지

책소개

목차

본문인용

서평

저자소개