파이썬과 기계 학습(acorn+PACKT 시리즈)
이 책의 이벤트
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
책 소개
이 책이 속한 분야
- 국내도서 > 컴퓨터/IT > 컴퓨터공학 > 인공지능 > 딥러닝/머신러닝
- 국내도서 > 컴퓨터/IT > 프로그래밍 언어 > Python(파이썬)
- 국내도서 > 컴퓨터/IT > 대학교재
- 국내도서 > 대학교재 > 컴퓨터
이 책의 총서 (299)
작가정보
저자(글) 라울 가레타
저자 라울 가레타(Ra?l Garreta)는 기계 학습(Machine Learning)과 자연어 처리(NLP)를 전공했고, 인공지능(AI, Artificial Intelligence)의 이론과 실무에 경험이 많은 컴퓨터 엔지니어다.
과학 애플리케이션, 기술, 인터넷 산업 및 스타트업 등 혁신적 사업에 관심이 많으며, 비디오 게임부터 주입형 의료 기기까지 다양한 제품을 다루는 여러 소프트웨어 회사에서 일했다. 2009년에는 인공지능을 지능형 소프트웨어 제품 개발에 적용하고자 Tryolabs를 공동 창업했다.
현재는 CTO이자 제품 관리자다. Tryolabs의 전문 기술은 NLP, 기계 학습 애플리케이션, 파이썬 프로그래밍 언어이며, 실리콘밸리의 많은 고객에게 기술 서비스를 제공하고 있다. 우루과이의 파이썬 커뮤니티와 공동 결성한 지역 PyDay와 PyCon 컨퍼런스에서도 활동하고 있다.
2007년부터 우루과이의 공화국대학교(Universidad de la Rep?blica)의 컴퓨터 학과에서 조교수로 근무하고 있다. 기계 학습, NLP, 오토마타 이론과 정형 언어 수업을 맡고 있다. 기계 학습과 NLP로 석사 학위를 마쳤으며 로보틱스(Robotics), 퀀텀 컴퓨팅(Quantum Computing), 인지 모델링(Cognitive Modeling)의 연구와 애플리케이션에 관심이 많다. 열렬한 기술 지지자이자 SF소설 애독자이며 영화, 사진, 그림과 같은 예술의 열혈 팬이다.
저자(글) 기예르모 몬세치
저자 기예르모 몬세치(Guillermo Moncecchi)는 우루과이 공화국대학교의 자연어 처리(NLP) 연구원이다. 우루과이 공화국대학교에서 인포매틱스로 박사 학위를 받았고 프랑스 파리 제10대학(Universit? Paris Ouest)에서 언어 과학으로도 박사 학위를 취득했다.
NLP에 관한 몇몇 국제적인 프로젝트에 참여했고 오토마타 이론, 자연어 처리, 기계 학습을 근 15년째 가르치고 있다.
우루과이 수도인 몬테비데오 의회의 최고 개발자로 일하고 있으며 일부 의회 공공 서비스, 특히 지리정보 시스템을 개발했다. 몬테비데오의 데이터 공개 및 이용을 촉구하는 몬테비데오 오픈 데이터 무브먼트(Montevideo Open Data movement) 대표 중 한 명이다.
번역 전철욱
역자 전철욱은 웹의 개방성, 파이썬의 기민성, 기계 학습의 예측성을 좋아한다. 공익을 위한 재능을 만들고자 노력 중이다. 호주에서 여우 세 마리에게 잡혀 살고 있다. 에이콘출판사의 『Julia 프로그래밍』(2015), 『Building Machine Learning Systems with Python 한국어판 (개정판)』(2015), 『R을 활용한 기계 학습』(2014)을 번역했다
작가의 말
내일 날씨가 맑을지 비가 올지 예측한다고 가정해보자. 날씨 예측을 위해 다소 복잡한 규칙 집합을 사용해 현재 날씨와 기상 지식을 바탕으로 알고리즘을 개발할 수 있다. 지난 5년 동안 매일 날씨를 기록했더니 연속해서 이틀 동안 맑은 날씨이면 다음 날도 맑은 날씨였다는 점을 발견했다. 알고리즘은 이를 일반화할 수 있고 어제와 오늘 날씨가 맑았기 때문에 내일 날씨는 맑을 것으로 예측할 수 있다. 이 알고리즘은 경험에서 학습하는 꽤 간단한 예제다.
기계 학습(Machine Learning)은 이것이 전부다. 사용할 수 있는 데이터로 학습하는 알고리즘이다. 이 책에서는 문서 분류부터 이미지 인식까지 다양한 실제 문제를 해결하는 기계 학습 애플리케이션을 개발하는 일부 기법에 대해 학습한다.
단순하면서 널리 사용되는 프로그래밍 언어인 파이썬과 오픈소스 기계 학습 라이브러리인 scikit-learn을 사용하겠다. 각 장에서는 각기 다른 기계 학습 설정과 문제 해결을 위해 scikit-learn과 파이썬을 사용하는 단계별 예제를 보여줄 뿐만 아니라 두서너 개의 잘 연구된 기법도 보여준다. 또한, 정확도와 계산 비용의 관점으로 알고리즘의 성능을 향상해줄 팁과 트릭을 알려줄 것이다. - 저자
'기계 학습을 하는 자’와 ‘기계 학습을 당하는 자'
피타고라스 정리 a2+b2=c2는 중고등학교 수학 시간에 배우는 기본적인 공식이다. 이 공식을 조금 변형하면 유명한 ‘페르마의 마지막 정리’가 된다. 여기서 보기도 싫은 수학 공식을 설명하고자 하는 것은 아니다. 다만, 수학이 매우 추상적인 사고를 할 수 있는 도구라는 점은 강조하고 싶다. 사실, 데이터를 다루는 작업도 매우 추상적인 사고 과정이다. 나의 일부를 추상화해 내가 알지 못하는 정보를 구할 수도 있다. 이를테면, 나의 유전자를 추상화함으로써 암을 예측할 수 있다. 오늘도 사물들은 인류가 세어본 적도 없는 수많은 추상화된 데이터를 쏟아낸다. 데이터는 정보를 만들고 이를 토대로 결정한다. 내가 본 영화로 새 영화를 추천받고 영화를 본다. 이 과정에는 기계 학습이 관여한다. 단순한 통계를 벗어나 고도로 추상화된 기법이 데이터를 모래의 숨은 진주로 만든다. 기계 학습은 새로운 세상을 보게 하는 망원경이자 현미경이다. 플루서의 말을 인용하자면, 컴퓨팅 환경은 ‘기계 학습을 하는 자’와 ‘기계 학습을 당하는 자’로 분류될 것이다.
미비한 시작으로
기계 학습은 다양한 분야가 융합되어 있다. 먼저, 탁월한 계산력을 활용하기 위해 컴퓨터에 명령을 내려야 한다. 두 번째는 수학이다. 대부분의 기법은 확률/통계나 선형 대수를 바탕으로 이루어져 있다. 마지막으로 데이터다. 데이터는 이 모든 것에 기본이며, 넘쳐나지만 잘 활용하면 황금 원천이 된다. 이러한 관점에서 보면, 이 책은 기계 학습을 접하는 처음 독자에게 매우 유용하다.
파이썬은 쉬울 뿐만 아니라 과학 생태계를 지원하는 언어다. 파이썬 기계 학습 라이브러리 scikit-learn은 우리가 일일이 각 기법을 구현해야 할 번거로움을 대신해준다. 이 책에서는 복잡한 수학식을 다루지 않는다. 처음 접하는 독자에게 수식을 나열하며 세부적으로 설명하지 않는다. 오히려 수식 대신 개념으로 최대한 이해하기 쉽게 설명한다. 마지막으로 데이터는 기계 학습 기법의 개념을 잘 이해할 수 있도록 쉽고 구하기도 편한 실질적인 것을 선택했다.
배경지식이 없는 독자에게 이 모든 것이 쉽지는 않을 것이다. 피타고라스 정리를 다시 생각해보자. 조금만 생각해보면 이 정리를 만족하는 a, b, c를 구할 수 있고, 관심을 좀 더 가지면 '페르마의 마지막 정리'인 an+bn≠cn(n은 3 이상)에 도전해볼 수도 있다. 이 과정에서 다양한 수학적 기법을 알게 되며 흥미로운 세상을 만날 수도 있다. 이 책이 기계 학습을 심도 있게 학습하고자 하는 독자에게 피타고라스 정리와 같은 역할을 하면 좋겠다. 각 장에서 나온 기법을 실행해보고 약간씩 변경해보면서, 기법에 대한 세부사항과 수학적 배경지식을 찾아 학습해 자신이 원하는 분야에 기계 학습을 적용하길 바란다. - 역자
목차
- 1장 기계 학습: 친절한 소개
__scikit-learn 설치
____리눅스
____맥
____윈도우
____설치 확인
__첫 번째 기계 학습 기법: 선형 분류
__결과 평가
__기계 학습 종류
__기계 학습에 관련된 중요한 개념
__요약
2장 지도 학습
__서포트 벡터 머신과 이미지 인식
____서포트 벡터 머신 훈련
__나이브 베이즈로 텍스트 분류
____데이터 전처리
____나이브 베이즈 분류기 훈련
____성능 평가
__결정 트리와 타이타닉 가설 설명
____데이터 전처리
____결정 트리 분류기 훈련
____결정 트리 해석
____랜덤 포레스트: 무작위 결정
____성능 평가
__회귀로 주택 가격 예측
____첫 번째 도전: 선형 모델
____두 번째 도전: 회귀를 위한 서포트 벡터 머신
____세 번째 도전: 랜덤 포레스트 다시 보기
____평가
__요약
3장 비지도 학습
__주성분 분석
__k평균으로 손글씨 숫자 군집화
__다른 군집 기법
__요약
4장 고급 기능
__속성 추출
__속성 선택
__모델 선택
__격자 검색
__병렬 격자 검색
__요약
출판사 서평
★ 이 책에서 다루는 내용 ★
■ 파이썬 환경에서 scikit-learn 설치
■ 서포트 벡터 머신(Support Vector Machine)이나 나이브 베이즈(Na?ve Bayes) 등 다양한 기법을 활용함으로써 속성에 기반한 사물(문서, 얼굴, 꽃의 품종 등) 분류
■ 타이타닉호 탑승객의 생존 같은 특정 현상의 주원인을 설명하기 위해 결정 트리 사용
■ 회귀 기법으로 주택 가격 예측
■ 차원 축소를 사용한 데이터 분석과 시각화
■ 모델 선택을 통한 모델의 최적 매개변수 선택
■ 병렬 기술을 통한 모델 성능 향상
★ 이 책의 대상 독자 ★
기계 학습과 데이터 기반에 대한 소프트웨어 기술을 습득하고자 하는 개발자를 대상으로 한다.
★ 이 책의 구성 ★
1장, '기계 학습: 친절한 소개'에서는 간단한 분류(classification) 문제를 해결하면서 기계 학습의 주요한 개념을 알아본다. 꽃의 특성을 바탕으로 꽃 품종을 판별한다.
2장, '지도 학습'에서는 네 가지 분류 기법인 서포트 벡터 머신(Support Vector Machine), 나이브 베이즈(Na?ve Bayes), 결정 트리(decision tree), 랜덤 포레스트(Random Forests)를 소개하고 이러한 기법을 얼굴 인식, 텍스트 분류, 그리고 타이타닉호 사고에서 탑승객이 생존할 수 있었던 이유를 설명하는 데 사용한다. 보스턴 주택 가격을 예측하기 위해 서포트 벡터 머신과 랜덤 포레스트를 다시 보고 선형 모델(Linear Model)을 살펴본다.
3장, '비지도 학습'에서는 고차원 데이터를 2차원으로 시각화하기 위해 주성분 분석(Principal Component Analysis)으로 차원을 축소하는 기법을 살펴본다. k평균(k-means) 알고리즘을 사용해 유사성에 따라 손글씨 숫자의 인스턴스를 무리 짓는 군집화 기술을 소개한다.
4장, '고급 기능'에서는 데이터를 전처리하고 학습을 위해 최적의 속성을 선택하는 속성 선택(Feature Selection) 기법을 소개하며, 모델 선택(Model Selection) 기법도 살펴본다. 이용할 수 있는 데이터와 병렬 계산(parallel computation)을 활용해 최적의 매개변수를 선택한다.
기본정보
ISBN | 9788960778108 | ||
---|---|---|---|
발행(출시)일자 | 2016년 01월 04일 | ||
쪽수 | 144쪽 | ||
크기 |
188 * 235
* 11
mm
/ 383 g
|
||
총권수 | 1권 | ||
시리즈명 |
acorn+PACKT 시리즈
|
||
원서(번역서)명/저자명 | Learning scikit-learn: Machine Learning in Python/Raul Garreta |
Klover 리뷰 (2)
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집 (0)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)
기분 좋은 발견
이 분야의 베스트
이 분야의 신간
-
AI와 보험(큰글자책)10% 22,500 원
-
AI와 보험10% 10,800 원
-
예측형 AI와 대학 입시(큰글자책)10% 22,500 원
-
예측형 AI와 대학 입시10% 10,800 원
-
AI와 공공 정책(큰글자책)10% 22,500 원