[출판사 리뷰]
누구나 쉽게 다양한 한국어 텍스트 데이터를 분석할 수 있다!
준비: 코랩 환경과 파이썬 기초
이 책의 예제와 프로젝트는 코랩에서 설치 없이, 클릭만으로 바로 실행할 수 있다. 본격적인 프로젝트를 시작하기 전에 텍스트 분석에 필요한 파이썬 기초 개념과 필수 파이썬 라이브러리인 판다스, 넘파이, 사이킷런의 기본 사용법을 살펴보면서, 텍스트 데이터 전처리 기능과 방법을 익힌다.
개념: 텍스트 분석 방법의 기본 개념
컴퓨터가 한국어를 어떻게 이해하는지, 텍스트 데이터를 어떻게 분석하는지 텍스트 분석 방법의 기본 개념을 이해한다. 그리고 머신러닝/딥러닝 라이브러리를 사용하기 위해 텍스트를 수치 형태의 데이터로 변환하는, 벡터화 방법으로 단어 가방 모형과 TF-IDF를 배운다.
프로젝트: 네 가지 실제 프로젝트 분석
네 가지 다른 한국어 데이터를 가지고 실제 프로젝트를 진행해본다. (1) 연합뉴스 타이틀 주제 분류 (2) 국민청원 텍스트 분석 (3) 120다산콜재단 데이터 토픽 모델링과 유사도 분석 (4) 인프런의 이벤트 댓글 텍스트 군집 분석
[추천평]
처음 운전을 배울 때, 자동차에 대한 모든 것을 알 필요도 없고 그렇게 가르쳐 주지도 않습니다. 자동차를 운전할 수 있는 기본 요령만 알고 시작합니다. 운전에 재미를 붙이고 익숙해지고 난 뒤에 하나씩 자동차에 대해서 알아가면 됩니다. 자연어 처리도 이와 비슷합니다. 책의 내용을 차분히 따라 하다 보면, 어느새 작은 규모의 프로젝트를 손수 구성해 볼 수 있을 것입니다.
송상헌_고려대학교 언어학과
이 책은 이론 설명에서 멈추지 않고, 데이터 획득, 코드 실습 방법을 알려 주면서 일반인도 쉽게 보고 만지면서 이해할 수 있게 해 줍니다. 첫 장을 들추고 마지막 장을 덮기까지 책을 손에서 놓기가 어려운 짜임새, 읽기 쉬운 문장들이 저자의 지식을 독자에게 쉽게 전달하기 위해 정성을 많이 들였다는 것을 알 수 있었습니다.
전창욱_LG AI Research
이 책은 기본을 이해하고, 실제 사용 방법을 익힐 수 있는 매우 좋은 책이다. 초보자부터 전문가까지 모두에게 유용한 자료가 되기를 기대한다.
고병일_카카오엔터프라이즈 자연어 처리 개발자
자연어 처리 분야에서 오랫동안 교육과 연구에 전념해 온 두 분이 함께 내신 책인 만큼 사례 위주로 접근해 나의 연구에 적용해 볼 것을 권합니다. 텍스트 분석은 해당 분야를 전공한 개발자나 연구자뿐만 아니라 다른 백그라운드를 지닌 개발자, 사업을 기획/운영하는 사람, 도메인 전문가 들이 21세기에 꼭 배워야 할 기술 중 하나라고 생각합니다.
이상열_데이터 분석가, 엔픽셀 데이터사이언스 셀장
자연어 처리 전성 시대에 텍스트 분석에 대한 다양한 예제와 자세한 설명이 담긴 책이 나와서 너무 즐겁게 읽었습니다. 실습에 필요한 내용도 꼼꼼하게 잘 들어 있고, 코드에 대한 설명도 이해하기 쉽게 되어 있어서 텍스트 분석에 입문하는 분도, 경험이 있으신 분도 많은 도움을 받을 것입니다.
이진원_뉴블라 CTO, AI 반도체 개발 및 AI 알고리즘 연구
초심자가 따라갈 수 있을 정도의 친절함과 필요한 내용만 담은 간결함, 두 마리 토끼를 동시에 잡은 책입니다.
김태권_만화가
초심자가 이해하기 쉽게 설명한 내용들, 실행하며 따라 하기 좋은 예제 코드들이 가니시(garnish)처럼 매력을 더해 줍니다. 특히 후반부의 매력적인 프로젝트들은 자연어 처리로 무엇을 할 수 있는지 궁금한 분들이 이 책을 펼치게 만들어 줄 것입니다.
김현_자연어 처리 연구자
한글 텍스트 분석을 시작할 때 모두가 참고하던 명강의가 드디어 책으로 탄생했다는 기쁜 소식을 듣고 한걸음에 베타테스트를 신청했습니다. 손에 잡히는 예제들을 차곡차곡 쌓아 올린 뒤, 실무에서 사용할 수 있을 만큼 흥미로운 프로젝트 사례까지 차근차근 실습해 볼 수 있어서 좋았습니다. 자연어 처리를 처음 시작하는 모두에게 가장 좋은 길잡이가 되어 줄 것입니다!
송석리_서울고등학교 교사, 『모두의 데이터 분석』저자
유튜브 강의로 이미 검증된 내용을 책에 담았기 때문에 무겁지 않고 가볍게 볼 수 있었습니다. 이 책을 통해 텍스트 분석과 조금 더 가까워질 것입니다!
송진영_데이터 분석가, 방송통신대학교 통계학과
누구나 궁금할 만한 실제 예제를 통해 가볍게 텍스트 분석을 익힐 수 있습니다. 구글 코랩을 이용해 원격으로 실습하게 되어 있어서 누구나 어디서나 공부할 수 있고, 텍스트 분석 전 과정을 다양한 측면에서 즐겁게 체험해볼 수 있는 입문서입니다.
이요셉_솔루티스 그린솔루션연구소 실장