본문으로 바로가기
평면표지(2D 앞표지)
입체표지(3D 표지)
2D 뒤표지

쓸모 있는 AI 서비스 만들기

사전 학습 모델로 빠르게 구현하는 실전 AI 프로젝트 가이드


  • ISBN-13
    979-11-6921-255-7 (93000)
  • 출판사 / 임프린트
    한빛미디어(주) / 한빛미디어
  • 정가
    27,000 원 확정정가
  • 발행일
    2024-07-18
  • 출간상태
    출간
  • 저자
    김경환
  • 번역
    -
  • 메인주제어
    인공지능
  • 추가주제어
    기계학습 , 음성인식 , 컴퓨터비전
  • 키워드
    #인공지능 #기계학습 #음성인식 #컴퓨터비전 #머신러닝 #ML #사전학습 모델 #파이썬 #AI #자연어처리 #OCR #객체인식 #이미지생성 #이미지변환 #모델서빙 #챗GPT
  • 도서유형
    종이책, 무선제본
  • 대상연령
    모든 연령, 성인 일반 단행본
  • 도서상세정보
    138 * 235 mm, 320 Page

책소개

현직 개발자가 다양한 예제로 알려 주는
쉽고 빠른 나만의 AI 서비스 개발 가이드

 

각종 AI 서비스가 넘쳐 나는 요즘, 이론만 배운 상태에서 곧바로 나만의 AI 서비스를 개발하려 한다면 구현 순서를 헷갈리거나 예상치 못한 상황에 당황하는 등 여러 어려움에 직면할 수 있습니다. 이 책은 이러한 어려움을 극복하고 실용적인 AI 서비스를 구현하려는 초보 개발자를 위해 만들어졌습니다. 꼭 배워야 할 활용도 높은 AI 서비스를 엄선하고, 유스케이스 작성과 같은 기획 단계부터 사전 학습 모델과 파이썬을 활용한 실습 단계까지 한 권에 담았습니다. 특히 단계별로 따라 하다 보면 자연스럽게 쓸모 있는 AI 서비스를 개발할 수 있다는 점이 이 책의 큰 장점입니다.
이 책은 현업 개발자부터 AI/머신러닝 분야 취업 준비생까지 다양한 학습 경험을 가진 독자를 대상으로 합니다. 사전 학습 모델과 애플리케이션의 기초부터 활용까지 폭넓게 다루고, 서비스 분야별 시장 규모와 전망, 활용 사례까지 소개해 트렌드를 읽는 안목과 인사이트를 기를 수 있는 기회를 제공합니다.
이 책을 읽고 나면 나만의 아이디어로 실용적인 AI 서비스를 개발할 수 있다는 자신감을 충분히 가질 수 있습니다. 실제 AI 서비스 구현을 통해 아이디어를 실현하는 즐거움을 체험하려는 모든 이에게 강력하게 추천합니다.

목차

저자의 말
AI 개발 트렌드와 현재 ‘쓸모 있는’ AI
- AI의 발전
- 파운데이션 모델과 활용 사례


키워드로 살펴보는 학습 로드맵
순서로 살펴보는 학습 로드맵

chapter 1 괴발개발 손글씨도 읽어 내는 OCR 서비스

1. 1  OCR 개념과 사례
- 개념 이해
- 활용 사례
 

1. 2  알아야 하는 기술 키워드
- 인코더-디코더
- 토크나이저
 

1. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

1. 4  모델 선정하기
- 사전 학습 모델의 장점
- 허깅페이스에서 모델 탐색하기
- 모델 선정하기 - TrOCR
- 모델 정보 얻기
- 모델 테스트하기 - 예제 이미지
- 모델 테스트하기 - 임의의 손글씨 이미지
- 모델 사용법 확인하기
 

1. 5  모델 실행하기
- 실습 환경 설정하기
- TrOCR 모델 실행하기
 

1. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 이미지 파일 업로드 UI 구현하기
- TrOCR 추론기 클래스 구현하기
- 추론 기능 구현하기
- 캔버스 UI 구현하기

chapter 2 사진 속 알맹이만 쏙쏙, 배경을 제거해 주는 이미지 세그멘테이션 서비스

2. 1  이미지 세그멘테이션 개념과 사례
- 개념 이해
- 활용 사례
 

2. 2  알아야 하는 기술 키워드
- 클래스
- 세그멘테이션 마스크
- 바운딩 박스
 

2. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

2. 4  모델 선정하기
- 모델 선정하기 - Segment Anything Model
- 모델 구조 및 특징 파악하기
 

2. 5  모델 실행하기
- 실습 환경 설정하기
- SAM 모델 실행하기
 

2. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 애플리케이션 UI 구현하기
- 마우스 클릭 이벤트 구현하기
- SAM 추론기 클래스 구현하기
- 추론 및 배경 제거 후처리 구현하기

chapter 3 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스

3. 1  자연어 처리 개념과 사례
- 개념 이해
- 활용 사례
 

3. 2  알아야 하는 기술 키워드
- 자연어
- 언어 모델
- 초거대 언어 모델
- 프롬프트와 프롬프트 엔지니어링
- 업스트림 태스크와 다운스트림 태스크
- 웹 스크래핑
- API
 

3. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

3. 4  모델 선정하기
- 모델 선정하기 - GPT
- GPT API
 

3. 5  모델 실행하기
- OpenAI API 키 사용하기
- 실습 환경 설정하기
- GPT 모델 실행하기
 

3. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 챗봇 UI 구현하기
- GPT API로 기본적인 챗봇 구현하기
- News API를 활용해 뉴스 기사 정보 가져오기
- 함수 호출 기능을 활용한 뉴스 기사 탐색 챗봇 구현하기
- 뉴스 기사 요약 및 번역 UI 구현하기
- 뉴스 제목 리스트 선택 기능 구현하기
- 뉴스 기사 스크래핑하기
- 뉴스 기사 요약 및 번역 기능 구현하기

chapter 4 영상 속 대화를 글로 변환해 주는 음성 인식 서비스

4. 1  음성 인식 개념과 사례
- 개념 이해
- 활용 사례
 

4. 2  알아야 하는 기술 키워드
- 자동 음성 인식
- 스펙트로그램
- SRT 포맷
 

4. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

4. 4  모델 선정하기
- 모델 선정하기 – 위스퍼
- 위스퍼 모델의 구조
 

4. 5  모델 실행하기
- 실습 환경 설정하기
- 위스퍼 모델 실행하기 - 라이브러리 활용
- 위스퍼 모델 실행하기 - API 활용
- 유튜브 영상의 음성을 자막으로 만들기
 

4. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 애플리케이션 UI 구현하기
- 유튜브 링크에서 영상 가져오기
- Writer 클래스를 활용해 SRT 자막 파일 만들기 - 라이브러리 활용
- Writer 클래스를 활용해 SRT 자막 파일 만들기 - API 활용
- 위스퍼 추론기 구현하기

chapter 5 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스

5. 1  이미지 생성 개념과 사례
- 개념 이해
- 활용 사례
 

5. 2  알아야 하는 기술 키워드
- 오토인코더
- 잠재 공간
 

5. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

5. 4  모델 선정하기
- 디퓨전 모델의 기본 개념
- 디퓨전 모델의 발전
- 모델 선정하기 – 스테이블 디퓨전
 

5. 5  모델 실행하기
- 실습 환경 설정하기
- 스테이블 디퓨전 모델 실행하기
- 다양한 스테이블 디퓨전 모델 다운로드하기
 

5. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 스케치 투 이미지 생성 UI 구현하기
- 모델 다운로드 UI 구현하기
- 모델 다운로드 기능 구현하기
- 모델 불러오기 UI 및 기능 구현하기
- 스케치 투 이미지 생성 기능 구현하기

찾아보기 

본문인용

-

서평

빠르게 변하는 AI 서비스의 트렌드를 따라 잡고 싶다면
서비스 구현 방법을 기초부터 활용까지 배우고 싶다면
AI 이론 학습 후 다양한 실전 개발 경험이 필요하다면

 

》 하나, 키워드로 한눈에 파악하는 원리와 트렌드
AI 서비스 구현 방법을 배우는 진정한 목적은 원리를 이해하고 나만의 서비스를 만들어보는 데 있습니다. 특히 구현한 서비스가 시장성이 높은, 즉 쓸모 있는 서비스라면 더할 나위 없이 좋습니다. 이 책은 이러한 부분까지 나아갈 수 있도록 실습 외에도 주제별 개념과 사례, 서비스를 구현하는 키워드 기술을 알려 주어 학습자들이 서비스의 원리를 이해하고 유용한 서비스를 구현할 수 있도록 돕습니다.
이에 더해 주제의 시장성과 전망 분석을 제공하여 요즘 서비스 트렌드를 읽는 눈과 다양한 AI 서비스 중에서도 필수 서비스를 파악하는 통찰력을 키울 수 있습니다.

 

》 둘, 체계적인 개발 가이드로 개발 사이클 이해
5가지 AI 서비스를 구현하는 과정에서 주요 순서를 3단계에 걸쳐 반복 학습하면서 실제 구현 과정을 자연스럽게 이해하도록 구성했습니다. ① 해당 서비스 구현에 적합한 사전 학습 모델을 탐색하고 선정하는 방법을 배우며, ② 사전 학습 모델의 사용법을 익히고 서비스 구현 준비를 합니다. ③ 실제 서비스 구현 및 검증 과정을 거쳐 최종적으로 완전한 서비스를 구현합니다. 이 책의 학습 로드맵을 따라가다 보면 하나의 AI 서비스를 구현하는 과정이 자연스럽게 머릿속에 새겨집니다.

 

》 셋, 쉽게 이해하면서도 깊이 있는 실습을 위한 다양한 구성
초보 독자들이 쉽게 이해할 수 있도록 각종 그림과 따라 하기 구성을 적용했습니다. 〈유스케이스 다이어그램〉을 그림으로 표현해 최종 사용자의 요구사항과 화면, 기능들을 기획하는 과정을 직접 보여 주고, 저자가 구현해 놓은 코랩 예제를 따라 하다 보면 빠르고 정확하게 서비스를 구현할 수 있습니다.
저자 깃허브에서 추가 학습을 위한 각종 예제 파일을 제공하고 있으며, 궁금한 점은 언제든지 질문할 수 있어 더 깊이 있고 다양한 학습이 가능합니다. AI 서비스를 쉽고 빠르게 구현하면서 모르는 부분은 저자와 소통하며 배워 나갈 수 있으니, 지금 바로 도전해 보세요.
▶ 저자 깃허브: https://github.com/mrsyee


이 책은 누구를 위한 책인가요?
》 현업 AI 서비스 (주니어) 개발자
》 AI/머신러닝 분야 취업 준비생
》 생성형 AI의 빠른 변화를 따라잡고자 서비스를 구현해 보려는 개발자
》 AI 이론을 학습했으나 개발 경험은 부족한 개발자

저자소개

저자 : 김경환
머신러닝 엔지니어이자 소프트웨어 개발자로서 의료 AI 소프트웨어 개발 기업 메디픽셀(Medipixel), 산업 설비 AI 소프트웨어 개발 기업 원프레딕트(OnePredict) 등 다양한 분야의 기업에서 근무하며 경험을 쌓았다.
또한, 파이썬 입문, 강화학습 등의 주제로 삼성 소프트웨어 아카데미, LG, 멀티캠퍼스 등에서 강의를 진행했다.
현재는 게임/엔터테인먼트 기업인 스마일게이트(Smilegate)에서 AI 서비스를 개발하는 중이며, 머신러닝과 딥러닝 모델을 서빙 및 배포하는 업무를 담당하고 있다.
평소 사용자와 직접 소통하며 실용적인 서비스를 개발하는 것을 지향하며, 머신러닝 기술을 서비스에 응용하는 데 관심이 많다. 또한, 효율적인 협업을 위한 팀 문화와 시스템 구축에도 많은 관심을 기울이고 있다.
상단으로 이동