입문에서 컴피티션까지 파이썬으로 시작하는 캐글
도서+교보Only(교보배송)을 함께 15,000원 이상 구매 시 무료배송
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

작가정보
저자(글) 이시하라 쇼타로
-동경대 공학부 시스템 창성학과 졸업
-캐글 마스터(https://kaggle.com/sishihara)
-2019년 3월에 공개한 Qiita의 캐글 입문 글에 1,600개 이상의 ‘좋아요’ 달성
-2019년 4월에 ‘PetFinder.my Adoption Prediction’ Competition에서 우승
-2019년 12월에 ‘Kaggle Days Tokyo’에서 Competition 개최
-현재 일본경제신문사에서 데이터 분석가로 근무 중
저자(글) 무라타 히데키
-홋카이도대학 이학부 교학과 졸업
-캐글 마스터(https://kaggle.com/currypurin)
-2019년 6월에 ‘LANL Earthquake Prediction’ Competition에서 3위 수상
-2018년 8월에 ‘Santander Value Prediction Challenge’ Competition에서 솔로 금메달 획득(8위)
-캐글 입문자를 위한 동인지 《캐글 튜토리얼》이 2,500부 이상 판매됨
-현재 전업 캐글러로 활약 중
출근하는 게 싫어서 책을 집필하기 시작했다. 현재 직업 특성상 집에서 나갈 이유가 별로 없다는 것에 굉장히 만족하는 성격이기도 하다. 홍차와 커피를 좋아하며, 기타, 가야금, 그림 그리기, 스컬핑 등이 취미다. 책의 머리말을 작성하는 시점을 기준으로 이번이 59번째 책이다.
목차
- 제1장 캐글 개요 1
1.1 캐글이란? 2
1.2 캐글에서 사용하는 머신러닝 5
1.3 캐글 계정 만들기 8
1.4 Competitions 페이지 개요 10
1.5 환경 구축을 따로 하지 않아도 되는 ‘Notebooks’의 사용 방법 14
1.6 1장 정리 19
제2장 Titanic 문제 23
2.1 일단 submit해 보기! 25
2.2 전체적인 흐름 파악하기: submit까지의 처리 흐름 살펴보기 33
2.3 탐색적 데이터 분석해 보기 40
2.4 가설을 기반으로 새로운 특징량 만들기 56
2.5 다양한 머신러닝 알고리즘 사용해 보기 61
2.6 하이퍼파라미터 조정하기 68
2.7 ‘Cross Validation’의 중요성 74
2.8 앙상블 학습해 보기 85
2.9 2장 정리 91
제3장 Titanic에서 더 나아가기 93
3.1 여러 테이블 다루기 94
3.2 이미지 데이터 다루기 99
3.3 텍스트 데이터 다루기 108
3.4 3장 정리 116
제4장 더 공부하려면 117
4.1 참가할 Competition을 선택하는 방법 118
4.2 초보자를 위한 도전 방법 121
4.3 분석 환경 선택 방법 127
4.4 4장 정리 130
부록 샘플 코드에 대한 자세한 설명 133
A.1 2장 Titanic 문제 134
A.2 3장 Titanic에서 더 나아가자 152
마지막으로 162
책 속으로
Competition 참가자는 데이터를 스스로 준비할 필요가 없으며, 상위권으로 입상하면 상금을 받을 수 있습니다(하위권이라고 손해를 보는 일은 따로 없습니다). submit을 했을 때 곧바로 채점되고, 순위를 확인할 수 있어서 컴퓨터 게임처럼 순위를 높이려는 동기 부여가 되므로 머신러닝을 재미있게 배울 수 있습니다. _3p
그건 그런 것 같습니다. 캐글러들과 이야기할 때 ‘이것저것 다 해본다’라는 말을 많이 하는데요. 머신러닝 알고리즘이 효과가 있는지는 Dataset와 문제의 설정에 따라서 달라집니다. 그래서 머리로 ‘이것이 더 좋을 것이다’라고 생각하는 것보다는 일단 코드를 작성해서 실행해 보는 것이 중요한 것 같습니다. 만약 다른 사람의 해답을 보게 되더라도, 일단 손을 움직여서 한번 정도는 직접 submit해 보는 것이 좋다고 생각합니다. 이렇게 데이터의 사양, Competition의 특징을 파악하고 나서 해답을 보면 훨씬 잘 이해됩니다. _32p
이번 절에서는 탐색적 데이터 분석으로 데이터의 개요를 확인해서, 특징량들과 목적 변수의 관계를 확인했습니다. 구체적인 예로 시각화를 통해 ‘Parch와 SibSp 모두를 더한 ‘가족 인원 수’라는 특징량을 새로 만들어서, 예측 성능을 높일 수도 있다’라는 가설을 만들었습니다. _54p
이번 절에서는 이미지 데이터, 다음 절에서는 텍스트 데이터를 다루는 방법에 대해서 살펴보겠습니다. 다만 최근 급속하게 발전하고 있는 이미지 인식과 자연 언어 처리 분야를 이 책에서 모두 다루는 것은 불가능합니다. _99p
이 책에서는 파이썬을 사용해서 캐글을 살펴보았습니다. 초보자 대상 튜토리얼인 Titanic을
통해 캐글 기초를 배우고, 이어서 스스로의 힘으로 Competition할 수 있는 방법에 대해서 배웠습니다. _162p
출판사 서평
튜토리얼 형태의 캐글 & 머신러닝 입문서!
우승 경험이 있는 전업 캐글러 콤비가 설명하는 안정되고 알기 쉬운 지식!
캐글에서 승리하는 경험을 쌓기 위한 최고의 디딤돌!
이 책은 파이썬 언어를 사용해서 ‘캐글(Kaggle)’이라는 머신러닝 Competition(대회)에 참여할 수 있도록 해주는 입문서입니다. ‘Titanic: Machine Learning from Disaster’라는 초보자 튜토리얼을 주제로 캐글의 기초를 다룹니다.
단순하게 Titanic(타이타닉) 문제를 푸는 방법만 알려주는 것이 아니라, 스스로의 힘으로 다른 Competition에 참여할 때 필요한 지식을 함께 설명하므로 아직 미숙하여 체계적으로 정리된 지식을 필요로 하는 초심자에게 매우 적합합니다.
이 책의 특징
저자 모두 캐글 마스터이자 메달 수상 경험이 있어, 캐글 입문에 특화된 튜토리얼 형식으로 작성
주제가 장과 절 단위로 확실하게 구분되어 여러 지식을 단계적으로 습득 가능
이후 다른 Competition에 참가할 수 있도록 테이블 데이터, 이미지 데이터, 텍스트 데이터를 다루는 방법도 설명
중간중간 저자들의 대화를 수록하여 캐글과 관련된 생생한 경험 제공
프로그래밍과 파이썬 초보자를 위한 자세한 설명과 샘플 코드 완비
이 책의 대상 독자
캐글에 흥미가 있지만 어디부터 시작해야 할지 잘 모르겠다는 분
파이썬, 머신러닝을 간단하게 살펴본 상태에서 캐글에 도전하고 싶은 분
머신러닝을 직접 실습하면서 깊게 공부하고 싶은 분
파이썬과 머신러닝에 대해서 어느 정도 알지만 캐글은 처음이신 분
기본정보
ISBN | 9791190665841 ( 1190665840 ) | ||
---|---|---|---|
발행(출시)일자 | 2021년 04월 19일 | ||
쪽수 | 184쪽 | ||
크기 |
189 * 246
* 13
mm
/ 409 g
|
||
총권수 | 1권 | ||
시리즈명 |
제이펍의 인공지능
|
||
원서명/저자명 | PYTHONではじめるKAGGLEスタ-トブック/石原祥太郞 |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립