본문으로 바로가기
태극기이 누리집은 대한민국 공식 전자정부 누리집입니다.
평면표지(2D 앞표지)
입체표지(3D 표지)
2D 뒤표지

머신러닝, 핵심만 빠르게!

기초 수학 개념부터 딥러닝, 특성 공학, 데이터 불균형 처리, 앙상블, 모델 평가까지


  • ISBN-13
    978-89-6626-493-3 (93000)
  • 출판사 / 임프린트
    인사이트 / 인사이트
  • 정가
    24,000 원 확정정가
  • 발행일
    2025-10-30
  • 출간상태
    출간
  • 저자
    안드리 부르코프
  • 번역
    박해선
  • 메인주제어
    컴퓨터공학
  • 추가주제어
    -
  • 키워드
    #컴퓨터공학 #머신러닝 #딥러닝 #언어 모델 #AI
  • 도서유형
    종이책, 무선제본
  • 대상연령
    모든 연령, 학술 전문서
  • 도서상세정보
    172 * 225 mm, 199 Page

책소개

복잡한 이론은 덜고, 꼭 필요한 핵심만 담았다!
머신러닝을 익히는 가장 간결한 안내서
이 책은 전 세계 11개 언어로 번역되어 수천 개 대학에서 교재로 사용되는 베스트셀러로, 간결하고 명료하게 머신러닝을 설명한다. 기초 수학 개념부터 핵심 알고리즘, 딥러닝과 신경망까지 차근차근 다루며, 클러스터링, 토픽 모델링, 메트릭 학습, 추천 시스템 등 현대 머신러닝 문제 해결을 위한 완전한 도구를 제공한다. 실무에 꼭 필요한 기술을 중심으로 이론과 실제 구현을 연결해 누구나 빠르고 확실하게 배울 수 있다.
저자는 풍부한 실무 경험을 바탕으로 특성 공학, 정규화, 불균형 데이터셋 처리, 앙상블, 모델 평가 등 실제 프로젝트에 바로 적용할 수 있는 기술을 설명한다. 복잡한 수식에 얽매이지 않고 직관적인 설명과 예제로 구성되어 있어 기초를 견고하게 다지고 싶은 입문자부터 실무 역량을 넓히려는 실무자까지 모두에게 유용하다.
 

이 책에서 다루는 내용
- 심층 신경망을 포함한 지도 및 비지도 학습 알고리즘
- 본질을 살린 직관적이고 명확한 알고리즘 및 수학 개념 설명
- 모델 구축, 디버깅, 평가를 위한 실용 기법
- 앙상블, 추천 시스템, 메트릭 학습 등 고급 주제

목차

옮긴이의 글

추천의 글

지은이의 글

 

1장 소개

1.1 머신러닝이란? 

1.2 학습의 종류

1.2.1 지도 학습

1.2.2 비지도 학습

1.2.3 준지도 학습

1.2.4 강화 학습

1.3 지도 학습의 작동 원리

1.4 모델이 새로운 데이터에 작동하는 이유

 

2장 표기법과 정의

2.1 표기법

2.1.1 데이터 구조 
2.1.2 대문자 시그마(sigma) 기호

2.1.3 대문자 파이 기호 
2.1.4 집합 연산 
2.1.5 벡터 연산

2.1.6 함수 
2.1.7 max와 arg max 
2.1.8 할당 연산자

2.1.9 도함수와 그레이디언트

2.2 확률 변수

2.3 불편 추정량

2.4 베이즈 정리

2.5 파라미터 추정

2.6 파라미터 vs. 하이퍼파라미터

2.7 분류 vs. 회귀

2.8 모델 기반 학습 vs. 사례 기반 학습

2.9 얕은 학습 vs. 딥러닝

 

3장 기본 알고리즘

3.1 선형 회귀

3.1.1 문제 
3.1.2 해결책

3.2 로지스틱 회귀

3.2.1 문제 
3.2.2 해결책

3.3 결정 트리 학습

3.3.1 문제 
3.3.2 해결책

3.4 서포트 벡터 머신

3.4.1 잡음 다루기 
3.4.2 비선형성 다루기

3.5 k-최근접 이웃

 

4장 학습 알고리즘

4.1 학습 알고리즘의 구성요소

4.2 경사 하강법

4.3 머신러닝 엔지니어가 일하는 방법

4.4 학습 알고리즘의 특징

 

5장 기본 실무 기술

5.1 특성 공학

5.1.1 원핫 인코딩 
5.1.2 구간 분할 
  5.1.3 정규화

5.1.4 표준화 
5.1.5 누락된 특성 다루기

5.1.6 데이터 대체 기법

5.2 학습 알고리즘 선택

5.3 훈련 세트, 검증 세트, 테스트 세트

5.4 과소적합과 과대적합

5.5 규제

5.6 모델 성능 평가

5.6.1 혼동 행렬 
5.6.2 정밀도/재현율 
5.6.3 정확도

5.6.4 비용 민감도 기반 정확도 
5.6.5 ROC 곡선 아래 면적(AUC) 

5.7 하이퍼파라미터 튜닝

5.7.1 교차 검증

 

6장 신경망과 딥러닝

6.1 신경망

6.1.1 다층 퍼셉트론 
6.1.2 피드포워드 신경망

6.2 딥러닝

6.2.1 합성곱 신경망 
6.2.2 순환 신경망

 

7장 문제 해결

7.1 커널 회귀

7.2 다중 분류

7.3 단일 클래스 분류

7.4 다중 레이블 분류

7.5 앙상블 학습

7.5.1 부스팅과 배깅
7.5.2 랜덤 포레스트

7.5.3 그레이디언트 부스팅

7.6 시퀀스 레이블링

7.7 시퀀스-투-시퀀스 학습

7.8 능동 학습

7.9 준지도 학습

7.10 원샷 학습

7.11 제로샷 학습

 

8장 특수 기법

8.1 불균형한 데이터셋 다루기

8.2 결합 모델

8.3 신경망 훈련

8.4 고급 규제 기법

8.5 다중 입력 다루기

8.6 다중 출력 다루기

8.7 전이 학습

8.8 알고리즘 효율성

 

9장 비지도 학습

9.1 밀도 추정

9.2 군집

9.2.1 k-평균
9.2.2 DBSCAN과 HDBSCAN 

9.2.3 클러스터 개수 결정하기 
9.2.4 다른 군집 알고리즘

9.3 차원 축소

9.3.1 주성분 분석 
9.3.2 UMAP 

 

10장 다른 학습 방법

10.1 메트릭 학습

10.2 순위 학습

10.3 추천 학습

10.3.1 행렬 분해 방법
10.3.2 잡음 제거 오토인코더

10.4 자기 지도 학습: 단어 임베딩

10.5 이상치 탐지

 

11장 결론

11.1 이 책에서 다루지 않은 것들

11.2 감사의 글

11.3 다음에 읽을 책

본문인용

먼저 진실을 말하겠습니다. “기계는 학습하지 못합니다.” 일반적으로 '머신러닝(machine learning)'이 하는 일은 수학 방정식을 찾는 것입니다. 이 방정식을 입력 집합(훈련 데이터)에 적용하면 기대하는 출력을 생성합니다. 이 수학 방정식은 (훈련 데이터가 아닌) 다른 입력에 대해 대부분 올바른 출력을 생성합니다. 이때 조건은 입력 데이터의 분포가 훈련 데이터가 유래된 통계적 분포와 같거나 비슷해야 한다는 것입니다.
그렇다면 이런 과정은 왜 학습이 아닐까요? 입력을 약간 왜곡시키면 완전히 잘못된 출력이 나올 가능성이 높기 때문입니다. 이는 동물이 학습하는 방식과 다릅니다. 예컨대 여러분이 화면을 정면으로 보면서 게임을 배웠다면 화면이 조금 틀어져도 여러분은 여전히 비디오 게임을 잘 할 수 있을 것입니다. 하지만 머신러닝 알고리즘은 화면을 정면으로만 보고 훈련하고 회전을 인식하도록 훈련하지 않았다면 화면이 틀어진 상태에서는 비디오 게임을 제대로 하지 못할 것입니다.

  • - '지은이의 글' 중에서

서평

"이 책은 간결한 '데이터과학' 매뉴얼입니다. 고전적인 선형 회귀와 로지스틱 회귀에서부터 서포트 벡터 머신, 딥러닝, 부스팅, 랜덤 포레스트까지 폭넓게 다룹니다. 다양한 접근 방법에 대한 설명이 부족하지도 않으며, 관심이 있다면 책의 위키 사이트에서 특정 방법에 대한 추가 정보를 얻을 수도 있습니다."
- 개러스 제임스(Gareth James)_서던캘리포니아 대학교 데이터과학 및 운영학 교수, 베스트셀러 《An Introduction to Statistical Learning with Applications in R》의 공동 저자

 

이 책은 생략하지 않았습니다. 또한 핵심 개념을 짧은 문장으로 명확하게 설명해 주는 방식이 정말 마음에 들었습니다.
이 책은 입문자에게도 유용하며, 폭넓은 조망이 필요한 숙련자에게도 도움이 됩니다.”
- 오렐리앙 제롱(Aurélien Géron)_시니어 AI 엔지니어, 《핸즈온 머신러닝》 저자
 

“안드리는 머신러닝 전체를 100여 쪽에 요약하는 불가능한 작업을 시도했고, 실무자에게 유용한 이론과 실전 내용을
훌륭하게 선별해 냈습니다. 이 책은 머신러닝을 처음 접하는 독자에게 입문서로서 훌륭한 토대를 마련해 줄 것입니다.”
- 피터 노빅(Peter Norvig)_구글의 연구 디렉터, 세계적인 AI 교재 AIMA의 공동 저자

저자소개

저자 : 안드리 부르코프
두 아이의 아빠이며, 캐나다 퀘벡시에서 머신러닝 전문가로 활동하고 있다. 10년 전 AI 분야로 박사 학위를 취득한 후, 7년 동안 가트너에서 머신러닝 팀을 이끌었다. 전문 분야는 자연어 처리이며, 표층 학습 기법과 심층 학습 기법을 모두 적용해 최첨단 텍스트 추출 및 정규화 시스템을 개발했다. 현재는 True Positive Inc.의 대표로 머신러닝 도서를 집필하면서 다양한 기업에 자문을 제공하고 있다.
번역 : 박해선
기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했다. Google AI/Cloud GDE, Microsoft AI MVP이다. 텐서플로우 블로그(tensorflow.blog)를 운영하고 있으며, 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있다.
《혼자 만들면서 공부하는 딥러닝》(한빛미디어, 2025), 《혼자 공부하는 머신러닝+딥러닝 개정판》(한빛미디어, 2025), 《혼자 공부하는 데이터 분석 with 파이썬》(한빛미디어, 2023), 《챗GPT로 대화하는 기술》(한빛미디어, 2023), 《Do it! 딥러닝 입문》(이지스퍼블리싱, 2019)을 집필했다.
《밑바닥부터 만들면서 배우는 LLM》(길벗, 2025), 《핸즈온 LLM》(한빛미디어, 2025), 《머신 러닝 Q & AI》(길벗, 2025), 《개발자를 위한 수학》(한빛미디어, 2024), 《실무로 통하는 ML 문제 해결 with 파이썬》(한빛미디어, 2024), 《머신러닝 교과서: 파이토치 편》(길벗, 2023), 《스티븐 울프럼의 챗GPT 강의》(한빛미디어, 2023), 《핸즈온 머신러닝 3판》(한빛미디어, 2023), 《만들면서 배우는 생성 딥러닝 2판》(한빛미디어, 2023), 《코딩 뇌를 깨우는 파이썬》(한빛미디어, 2023), 《트랜스포머를 활용한 자연어 처리》(한빛미디어, 2022), 《케라스 창시자에게 배우는 딥러닝 2판》(길벗, 2022), 《개발자를 위한 머신러닝&딥러닝》(한빛미디어, 2022), 《XGBoost와 사이킷런을 활용한 그레이디언트 부스팅》(한빛미디어, 2022), 《구글 브레인 팀에게 배우는 딥러닝 with TensorFlow.js》(길벗, 2022), 《파이썬 라이브러리를 활용한 머신러닝 개정2판》(한빛미디어, 2022), 《머신러닝 교과서 3판》(길벗, 2021)을 포함하여 수십 권의 책을 우리말로 옮겼다.
상단으로 이동
  • (54866) 전북특별자치도 전주시 덕진구 중동로 63