본문으로 바로가기
평면표지(2D 앞표지)
입체표지(3D 표지)
2D 뒤표지

기초부터 다지는 통계학 교과서 with 파이썬


  • ISBN-13
    978-89-6626-462-9 (93500)
  • 출판사 / 임프린트
    인사이트 / 인사이트
  • 정가
    42,000 원 확정정가
  • 발행일
    2024-12-18
  • 출간상태
    출간
  • 저자
    개러스 제임스 , 다니엘라 위튼 , 트레버 헤이스티 , 로버트 팁시라니 , 조너선 테일러
  • 번역
    송영숙 , 유현조
  • 메인주제어
    인공지능
  • 추가주제어
    -
  • 키워드
    #인공지능 #통계학 #딥러닝 #머신러닝 #선형회귀 #로지스틱회귀 #K-최근접이웃 #선형판별분석 #교차검증 #부트스트랩 #능형회귀 #라쏘 #다항회귀 #스플라인 #결정트리 #랜덤포레스트 #부스팅 #서포트벡터머신 #주성분분석 #군집분석 #생존분석 #다중검정
  • 도서유형
    종이책, 무선제본
  • 대상연령
    모든 연령, 성인 일반 단행본
  • 도서상세정보
    188 * 240 mm, 760 Page

책소개

《기초부터 다지는 통계학 교과서 with 파이썬》은 지난 20년 동안 생물학, 금융, 마케팅, 천체물리학에 이르기까지 다양한 분야에서 등장한 방대하고 복잡한 데이터 세트를 이해하는 데 필수적인 통계적 학습 도구를 다룹니다. 이 책에서는 관련 응용 분야와 더불어 가장 중요한 모델링 및 예측 기법들을 소개합니다. 주요 주제로는 선형회귀, 분류, 재표집법, 축소 접근법, 나무-기반 방법, 서포트 벡터 머신, 군집화, 딥러닝, 생존분석, 다중검정 등이 포함됩니다. 컬러 도표와 실제 사례를 사용해 통계적 학습 방법을 군더더기 없이 명료하게 설명합니다. 이 책은 최첨단 통계 학습 기법을 사용해 데이터를 분석하려는 통계학자와 비통계학자 모두를 대상으로 합니다.  2013년에 쓰인 이 책의 전신인 R 버전은 베스트셀러 반열에 오른 도서로, 전 세계 유수 대학의 데이터과학, 통계학, 컴퓨터학과의 핵심 교재로 사용되고 있습니다. 그러나 최근 파이썬이 데이터과학 분야의 핵심 언어로 등장하면서 이를 반영한 도서에 대한 요구가 높아졌습니다. 이 책은 기존 실습 예제를 파이썬으로 구현함과 동시에 최신 통계 기법의 하나인 딥러닝을 추가해 새롭게 출시되었습니다. 

목차

1장 도입

 

2장 통계적 학습

2.1 통계적 학습이란 무엇인가?
2.2 모형의 정확도 평가
2.3 실습: 파이썬 기초

2.4 연습문제

 

3장 선형회귀

3.1 단순선형회귀

3.2 다중선형회귀

3.3 회귀모형에서 생각할 다른 문제들

3.4 마케팅 계획

3.5 선형회귀와 K-최근접이웃의 비교

3.6 실습: 선형회귀

3.7 연습문제

 

4장 분류

4.1 분류의 개요 
4.2 왜 선형회귀를 사용하지 않는가

4.3 로지스틱 회귀

4.4 생성모형을 이용한 분류

4.5 분류 방법 비교

4.6 일반화선형모형

4.7 실습: 로지스틱 회귀, LDA, QDA, KNN

4.8 연습문제

 

5장 재표집법

5.1 교차검증

5.2 부트스트랩

5.3 실습: 교차검증과 부트스트랩

5.4 연습문제

 

6장 선형모형선택과 규제

6.1 부분집합선택

6.2 축소 방법

6.3 차원축소법

6.4 고차원에서 생각할 점

6.5 실습: 선형모형과 규제 방법들

6.6 연습문제

 

7장 선형을 넘어서

7.1 다항회귀

7.2 계단함수

7.3 기저함수

7.4 회귀 스플라인

7.5 평활 스플라인

7.6 국소회귀

7.7 일반화가법모형

7.8 실습: 비선형모형

7.9 연습문제

 

8장 나무-기반의 방법

8.1 의사결정나무의 기초

8.2 배깅, 랜덤 포레스트, 부스팅 및 베이즈 가법회귀나무

8.3 실습: 나무-기반의 방법

8.4 연습문제

 

9장 서포트 벡터 머신

9.1 최대 마진 분류기

9.2 서포트 벡터 분류기

9.3 서포트 벡터 머신

9.4 2개 이상의 부류가 있는 SVM

9.5 로지스틱 회귀와의 관련성

9.6 실습: 서포트 벡터 머신

9.7 연습문제

 

10장 딥러닝

10.1 단층 신경망

10.2 다층 신경망

10.3 합성곱 신경망

10.4 문서 분류

10.5 순환 신경망

10.6 딥러닝을 사용할 때

10.7 신경망 적합

10.8 보간과 이중 하강

10.9 실습: 딥러닝

10.10 연습문제

 

11장 생존분석과 중도절단자료

11.1 생존시간과 중도절단시간

11.2 중도절단 좀 더 자세히 살펴보기

11.3 카플란-마이어 생존곡선

11.4 로그 순위검정

11.5 생존분석 회귀모형

11.6 콕스 모형을 위한 축소

11.7 추가 주제

11.8 실습: 생존분석

11.9 연습문제

 

12장 비지도학습

12.1 비지도학습의 도전

12.2 주성분분석

12.3 결측값 및 행렬 완성

12.4 군집화 방법

12.5 실습: 비지도학습

12.6 연습문제

 

13장 다중검정

13.1 가설검정에 대한 간략한 재검토

13.2 다중검정의 어려움

13.3 집단별 오류율

13.4 거짓발견율

13.5 재표집법을 통한 p-값과 거짓발견율

13.6 실습: 다중검정

13.7 연습문제

본문인용

“이 책은 통계학이나 관련 계량 분야를 전공하는 고급 학부생이나 석사 과정 학생 또는 자신의 데이터를 분석하기 위해 통계적 학습 도구를 사용하려는 다른 분야의 개인에게 적합하다.”(xiv쪽)

 

“통계적 학습'이란 '데이터를 이해하기' 위한 방대한 도구의 모음을 뜻한다.”(1쪽)

 

“이후 통계적 학습의 중요한 기법들을 파이썬으로 구현하려는 요구가 증가해 왔다. 이에 따라 이번 책에서는 실습 예제를 R에서 파이썬으로 변경했다.”(9쪽)

 

“각 장 마지막에는 하나 이상의 파이썬 실습을 제시해, 해당 장에서 논의된 여러 방법의 응용 프로그램을 체계적으로 살펴볼 예정이다. 이 실습들은 다양한 접근법의 장단점을 보여 줄 뿐만 아니라, 다양한 방법을 구현할 때 필요한 구문에 대한 유용한 참고 자료를 제공한다.”(14쪽)

서평

-

저자소개

저자 : 개러스 제임스
현재 에머리대학교 고이주에타 경영대학원의 교수다. 데이터 사이언티스트로도 활동하고 있다.
저자 : 다니엘라 위튼
현재 워싱턴대학교의 통계학 및 생물통계학과 교수다. 비지도학습을 중심으로 고차원 데이터를 위한 통계적 기계학습 방법을 연구하고 있다. 통계적 기계학습 분야 연구로 여러 번 수상했고 2023년부터 왕립통계학회지 B계열(Journal of the Royal Statistical Society, Series B)의 공동 편집장을 맡고 있다.
저자 : 트레버 헤이스티
스탠퍼드대학교 통계학과와 의과대학 생물의학데이터과학과 교수다. 2018년에는 미국국립과학원 회원으로 선출되었다. 200편 이상의 논문을 발표하고 6권의 저서를 집필했으며 특히 통계적 학습 이론에 큰 기여를 하고 있다.
저자 : 로버트 팁시라니
스탠퍼드대학교 통계학과와 생물의학데이터과학과 교수다. 주 연구 분야는 통계적 학습, 데이터 마이닝, 통계계산, 생물정보학 등으로 약 250편의 논문을 저술했다. ISI Web of Knowledge에서 선정한 수학 분야에서 가장 많이 인용되고 있는 저자(ISI Highly Cited Authors in Mathematics) 중 한 명이다.
저자 : 조너선 테일러
스탠퍼드대학교 통계학과 교수다. 주 연구 분야는 가우시안 과정(Gaussian processes), 확률 과정(stochastic processes), 미분기하학적 방법(differential geometric methods) 등이다.
번역 : 송영숙
국어학을 전공하고 (주)사이오닉에이아이에서 '리서치/정책총괄' 업무를 맡고 있다. 전산언어학과 상식 추론, 언어 유형론에 관심이 많다. 사람 언어와 기계 언어 간에 장벽을 줄이는 데 벽을 허물고 길을 내는 사람이 되려 하며, 그 일환으로 《모두의 한국어 텍스트 분석 with 파이썬》과 같은 책을 쓰거나 《파이썬을 활용한 딥러닝 전이학습》 책의 번역에 참여했다.
번역 : 유현조
언어학과 통계학을 전공했고 현재 충남대학교 언어학과 조교수다. 언어학과 통계학을 전공했다. 주요 관심 분야는 통계계산, 다변량 데이터 분석, 데이터 시각화, 통계적 학습 이론이다. 일반화 선형 혼합 모형을 이용한 실험 데이터 분석에도 관심을 가지고 종종 공동 연구도 수행하고 있다. 《R을 활용한 선형회귀분석》 집필, 웹 기반 통계 분석과 데이터 시각화를 위한 소프트웨어인 eStat(http://estat.me) 개발 등에 참여했다.
상단으로 이동