본문 바로가기

추천 검색어

실시간 인기 검색어

파이썬 데이터 사이언스 핸드북

IPython, Jupyter, NumPy, Pandas, Matplotlib, Scikit-Learn 라이브러리를 활용한 데이터 과학과 머신러닝 | 개정판
위키북스 데이터 사이언스 시리즈 89
제이크 밴더플래스 저자(글) · 김정인 번역
위키북스 · 2023년 03월 30일
가장 최근에 출시된 개정판입니다. 구판보기
10.0
10점 중 10점
(3개의 리뷰)
도움돼요 (50%의 구매자)
  • 파이썬 데이터 사이언스 핸드북 대표 이미지
    파이썬 데이터 사이언스 핸드북 대표 이미지
  • 파이썬 데이터 사이언스 핸드북 부가 이미지1
    파이썬 데이터 사이언스 핸드북 부가 이미지1
  • 파이썬 데이터 사이언스 핸드북 부가 이미지2
    파이썬 데이터 사이언스 핸드북 부가 이미지2
  • A4
    사이즈 비교
    210x297
    파이썬 데이터 사이언스 핸드북 사이즈 비교 188x240
    단위 : mm
01 / 04
MD의 선택 무료배송 소득공제
10% 34,200 38,000
적립/혜택
1,900P

기본적립

5% 적립 1,900P

추가적립

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 1,900P
  • 리뷰 작성 시, e교환권 추가 최대 300원
배송안내
무료배송
배송비 안내
국내도서/외국도서
도서 포함 15,000원 이상 구매 시 무료배송
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)

15,000원 미만 시 2,500원 배송비 부과

교보Only(교보배송)
각각 구매하거나 함께 20,000원 이상 구매 시 무료배송

20,000원 미만 시 2,500원 배송비 부과

해외주문 서양도서/해외주문 일본도서(교보배송)
각각 구매하거나 함께 15,000원 이상 구매 시 무료배송

15,000원 미만 시 2,500원 배송비 부과

업체배송 상품(전집, GIFT, 음반/DVD 등)
해당 상품 상세페이지 "배송비" 참고 (업체 별/판매자 별 무료배송 기준 다름)
바로드림 오늘배송
업체에서 별도 배송하여 1Box당 배송비 2,500원 부과

1Box 기준 : 도서 10권

그 외 무료배송 기준
바로드림, eBook 상품을 주문한 경우, 플래티넘/골드/실버회원 무료배송쿠폰 이용하여 주문한 경우, 무료배송 등록 상품을 주문한 경우
2/27(목) 출고예정
기본배송지 기준
배송일자 기준 안내
로그인 : 회원정보에 등록된 기본배송지
로그아웃 : '서울시 종로구 종로1' 주소 기준
로그인정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

키워드 Pick

키워드 Pick 안내

관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

많은 연구원에게 파이썬은 데이터를 저장, 가공하고 데이터에서 통찰력을 얻을 수 있는 라이브러리 덕분에 데이터를 다루기에 최고의 도구로 여겨진다. 여러 참고 자료에서 파이썬 라이브러리를 소개하지만, 대부분은 각 라이브러리를 개별적으로 다룬다. 하지만 《파이썬 데이터 사이언스 핸드북》 개정판에서는 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn을 비롯한 관련 도구를 모두 다루며, 데이터 과학 및 머신러닝 활용에 꼭 필요한 도구를 성공적으로 설정하고 사용하는 데 도움이 되는 명확하고 따라 하기 쉬운 예제를 제공한다.

파이썬 코드를 읽고 작성하는 데 익숙한 과학자나 데이터 분석가라면 이 책이 데이터의 가공, 변환, 정제와 다른 유형의 데이터 시각화, 통계 모델이나 머신러닝 모델 구축을 위한 데이터 활용 면에서 흔히 발생하는 문제를 해결하기에 가장 이상적인 종합 참고서가 될 것이다. 간단히 말해, 이 책은 파이썬으로 데이터 사이언스 분야를 배우기 위해 반드시 소장해야 할 책이다.

이 핸드북을 통해 다음 도구의 사용법을 학습할 수 있다.

◎ IPython과 Jupyter: 파이썬을 이용하는 데이터 과학자를 위한 컴퓨팅 환경 제공
◎ NumPy: 파이썬의 복잡한 데이터 배열을 효율적으로 저장하고 가공할 수 있는 ndarray(n 차원 배열 객체) 제공
◎ Pandas: 파이썬에서 레이블이 붙거나 칼럼 형식의 데이터를 효율적으로 저장하고 가공하기 위한 DataFrame 자료구조 제공
◎ Matplotlib: 파이썬을 이용한 유연한 데이터 시각화 기능 제공
◎ Scikit-Learn: 기존 머신러닝 알고리즘 중 가장 중요한 것을 파이썬으로 효율적이고 깔끔하게 구현한 라이브러리

이 책의 총서 (79)

작가정보

저자(글) 제이크 밴더플래스

Jake VanderPlas
제이크 밴더플래스는 파이썬 과학 스택의 장기 사용자이자 개발자다. 현재 워싱턴 대학교의 학제간 연구 부장으로 근무하면서 독자적인 천문학 연구를 수행하고 있으며 다양한 분야의 과학자와 함께 상담 및 컨설팅을 진행하고 있다.

번역 김정인

현재 기업 빅데이터 전략팀에서 근무하고 있다. 옮긴 책으로는 《실전! 파이토치 딥러닝 프로젝트》 《강화학습/심층강화학습 특강》 《실전! 텐서플로 2를 활용한 딥러닝 컴퓨터 비전》 《케라스로 구현하는 고급 딥러닝 알고리즘》 《실전! Core ML을 활용한 머신러닝 iOS 앱 개발》 《실전활용! 텐서플로 딥러닝 프로젝트》 《마이크로소프트 봇 프레임워크 프로그래밍》 《애자일 데이터 과학 2.0》 《구글 애널리틱스 완벽 가이드》 《파이썬 데이터 사이언스 핸드북》 《러닝 스칼라》가 있다.

목차

  • ▣ 1장: Jupyter - 파이썬에 날개를 달자
    IPython과 Jupyter 시작하기
    __IPython 셸 실행하기
    __Jupyter 노트북 실행하기
    __IPython의 도움말과 문서
    __IPython 셸에서 사용할 수 있는 키보드 단축키
    향상된 대화형 기능
    __IPython 매직 명령어
    __입력/출력 이력
    __IPython과 셸 명령어
    디버깅 및 프로파일링
    __에러와 디버깅
    __코드 프로파일링 및 시간 측정
    __IPython 추가 참고 자료

    ▣ 2장: NumPy 소개
    파이썬의 데이터 타입 이해하기
    __파이썬 정수는 정수 이상이다
    __파이썬 리스트는 리스트 이상이다
    __파이썬의 고정 타입 배열
    __파이썬 리스트에서 배열 만들기
    __처음부터 배열 만들기
    __NumPy 표준 데이터 타입
    NumPy 배열의 기초
    __NumPy 배열 속성 지정
    __배열 인덱싱: 단일 요소에 접근하기
    __배열 슬라이싱: 하위 배열에 접근하기
    __배열 재구조화
    __배열 연결 및 분할
    NumPy 배열 연산: 유니버설 함수
    __루프는 느리다
    __Ufuncs 소개
    __NumPy 유니버설 함수(Ufuncs)
    __고급 Ufunc 기능
    __Ufuncs: 더 알아보기
    집계: 최솟값, 최댓값, 그리고 그사이의 모든 것
    __배열의 값의 합 구하기
    __최솟값과 최댓값
    __예제: 미국 대통령의 평균 신장은 얼마일까?
    배열 연산: 브로드캐스팅
    __브로드캐스팅 소개
    __브로드캐스팅 규칙
    __실전 브로드캐스팅
    비교, 마스크, 부울 로직
    __예제: 비온 날 세기
    __ufunc으로서의 비교 연산자
    __부울 배열로 작업하기
    __마스크로서의 부울 배열
    __키워드 and/or vs. 연산자 &/| 사용하기
    팬시 인덱싱
    __팬시 인덱싱 알아보기
    __결합 인덱싱
    __예제: 임의의 점 선택하기
    __팬시 인덱싱으로 값 변경하기
    __예제: 데이터 구간화
    배열 정렬
    __NumPy의 빠른 정렬: np.sort와 np.argsort
    __행이나 열 기준으로 정렬하기
    __부분 정렬: 파티션 나누기
    __예제: k-최근접 이웃 알고리즘
    구조화된 데이터: NumPy의 구조화된 배열
    __구조화된 배열 만들기
    __고급 복합 타입
    __레코드 배열: 트위스트를 가진 구조화된 배열
    __Pandas로 넘어가며

    ▣ 3장: Pandas로 데이터 가공하기
    Pandas 객체 소개
    __Pandas Series 객체
    __Pandas DataFrame 객체
    __Pandas Index 객체
    데이터 인덱싱과 선택
    __Series에서 데이터 선택
    __DataFrame에서 데이터 선택
    Pandas에서 데이터 연산하기
    __유니버설 함수: 인덱스 보존
    __유니버설 함수: 인덱스 정렬
    __유니버설 함수: DataFrame과 Series 간의 연산
    누락된 데이터 처리하기
    __누락된 데이터 처리 방식의 트레이드오프
    __Pandas에서 누락된 데이터
    __Pandas의 널러블(Nullable) 데이터 타입
    __널 값 연산하기
    계층적 인덱싱
    __다중 인덱스된 Series
    __MultiIndex 생성 메서드
    __MultiIndex 인덱싱 및 슬라이싱
    __다중 인덱스 재정렬하기
    데이터세트 결합: Concat과 Append
    __복습: NumPy 배열 연결
    __pd.concat을 이용한 간단한 연결
    데이터세트 결합하기: 병합과 조인
    __관계 대수
    __조인 작업의 분류
    __병합 키 지정
    __조인을 위한 집합 연산 지정하기
    __열 이름이 겹치는 경우: suffixes 키워드
    __예제: 미국 주 데이터
    집계와 분류
    __행성 데이터
    __Pandas의 간단한 집계 연산
    __GroupBy: 분할, 적용, 결합
    피벗 테이블
    __피벗 테이블 시작
    __피벗 테이블 등장 배경
    __피벗 테이블 구문
    __예제: 출생률 데이터
    벡터화된 문자열 연산
    __Pandas 문자열 연산 소개
    __Pandas 문자열 메서드 목록
    __예제: 조리법 데이터베이스
    시계열 다루기
    __파이썬에서의 날짜와 시간
    __Pandas 시계열: 시간으로 인덱싱하기
    __Pandas 시계열 데이터 구조
    __정규 시퀀스: pd.date_range()
    __주기와 오프셋
    __리샘플링, 시프팅, 윈도잉
    __예제: 시애틀 자전거 수 시각화
    고성능 Pandas: eval()과 query()
    __query()와 eval()의 등장 배경: 복합 표현식
    __효율적인 연산을 위한 pandas.eval()
    __열 단위의 연산을 위한 DataFrame.eval()
    __DataFrame.query() 메서드
    __성능: 이 함수를 사용해야 하는 경우
    __추가 자료

    ▣ 04장: Matplotlib을 활용한 시각화
    일반적인 Matplotlib 사용법
    __matplotlib 임포트하기
    __스타일 설정하기
    __show()를 사용할 것인가, 말 것인가 - 플롯 표현 방법
    간단한 라인 플롯
    __플롯 수정하기: 선 색상과 스타일
    __플롯 조정하기: 축 경계
    __플롯에 레이블 붙이기
    __Matplotlib 주의사항
    간단한 산점도
    __plt.plot을 사용한 산점도
    __plt.scatter를 활용한 산점도
    __plot과 scatter의 차이: 효율성 측면에서 유의할 점
    __오차 시각화하기
    밀도 플롯과 등고선 플롯
    __3차원 함수 시각화하기
    __히스토그램, 구간화, 밀도
    __2차원 히스토그램과 구간화
    플롯 범례 맞춤 변경하기
    __범례에 사용할 요소 선택하기
    __점 크기에 대한 범례
    __다중 범례
    색상 막대 맞춤 변경하기
    __색상 막대 맞춤 변경하기
    __예제: 손으로 쓴 숫자
    다중 서브플롯
    __plt.axes: 직접 만든 서브플롯
    __plt.subplot: 간단한 서브플롯의 그리드
    __plt.subplots: 한 번에 전체 그리드 만들기
    __plt.GridSpec: 복잡한 배치
    텍스트와 주석
    __예제: 미국 출생률에 휴일이 미치는 영향
    __변환 및 텍스트 위치
    __화살표와 주석
    눈금 맞춤 변경하기
    __주 눈금과 보조 눈금
    __눈금 또는 레이블 숨기기
    __눈금 개수 줄이기와 늘리기
    __팬시 눈금 포맷
    __위치 지시자와 서식 지시자 요약
    Matplotlib 맞춤변경하기: 설정과 스타일시트
    __직접 플롯 변경하기
    __기본값 변경하기: rcParams
    __스타일시트
    Matplotlib에서 3차원 플로팅하기
    __3차원 점과 선
    __3차원 등고선 플롯
    __와이어프레임과 표면도
    __표면 삼각측량법
    Seaborn을 활용한 시각화
    __Seaborn 플롯 탐색하기
    __예제: 마라톤 완주 시간 탐색
    __추가 자료
    __기타 파이썬 그래픽 라이브러리

    ▣ 5장: 머신러닝
    머신러닝이란 무엇인가?
    __머신러닝의 범주
    __머신러닝 응용의 정성적 사례
    __정리
    Scikit-Learn 소개
    __Scikit-Learn에서의 데이터 표현 방식
    __Estimator API
    __응용: 손으로 쓴 숫자 탐색
    __정리
    초모수와 모델 검증
    __모델 검증에 대한 고려사항
    __최적의 모델 선택하기
    __학습 곡선
    __실제 검증: 그리드 검색
    __정리
    특징 공학
    __범주 특징
    __텍스트 특징
    __이미지 특징
    __유도 특징
    __누락 데이터의 대체
    __특징 파이프라인
    심화 학습: 나이브 베이즈 분류
    __베이즈 분류
    __가우스 나이브 베이즈
    __다항분포 나이브 베이즈
    __언제 나이브 베이즈 모델을 사용할 것인가
    심화 학습: 선형 회귀
    __단순 선형 회귀
    __기저 함수 회귀
    __정규화
    __예제: 자전거 통행량 예측
    심화 학습: 서포트 벡터 머신
    __서포트 벡터 머신의 동기
    __서포트 벡터 머신: 마진 최대화
    __예제: 안면 인식
    __정리
    심화 학습: 의사결정 트리와 랜덤 포레스트
    __랜덤 포레스트 등장 배경: 의사결정 트리
    __추정 모델의 앙상블: 랜덤 포레스트
    __랜덤 포레스트 회귀
    __예제: 랜덤 포레스트를 사용한 숫자 분류
    __정리
    심화 학습: 주성분 분석
    __주성분 분석 소개
    __PCA 응용: 노이즈 필터링
    __예제: 고유얼굴
    __정리
    심화 학습: 다양체 학습
    __다양체 학습: ‘HELLO’
    __다차원 척도법(MDS, Multidimensional Sacling)
    __비선형 다양체 학습: 국소 선형 임베딩
    __다양체 방식에 대한 몇 가지 생각
    __예제: 얼굴 데이터에 아이소맵 적용
    __예제: 숫자 데이터의 구조 시각화
    심화 학습: k-평균 군집화
    __k-평균 소개
    __기댓값-최대화
    __예제
    심화 학습: 가우스 혼합 모델
    __GMM 등장 배경: k-평균의 약점
    __E-M 단계 일반화하기: 가우스 혼합 모델
    __공분산 유형 선택하기
    __밀도 추정에 GMM 사용하기
    __예제: 새로운 데이터를 생성하는 GMM
    심화 학습: 커널 밀도 추정
    __KDE 등장 배경: 히스토그램
    __커널 밀도 추정의 실제 적용
    __교차 검증을 통한 대역폭 선택
    __예제: 나이브하지 않은 베이즈(Not-So-Naïve Bayes)
    응용: 안면 인식 파이프라인
    __HOG 특징
    __실제 HOG: 간단한 안면 인식기
    __주의사항 및 개선사항
    __머신러닝 관련 추가 자료

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수, 시리즈명, 원서(번역서)명/저자명을(를) 나타낸 표입니다.
ISBN 9791158394271
발행(출시)일자 2023년 03월 30일
쪽수 588쪽
크기
188 * 240 * 32 mm / 1210 g
총권수 1권
시리즈명
위키북스 데이터 사이언스 시리즈
원서(번역서)명/저자명 Python Data Science Handbook/Vanderplas, Jake

Klover 리뷰 (3)

구매 후 리뷰 작성 시, e교환권 200원 적립

10점 중 10점
/추천해요
데이터 사이언티스트가 되고자 하는 자들의 필독서 입니다. 추천합니다.
10점 중 10점
/도움돼요
파이썬 공부에 도움이 됩니다. 여러 파이썬 책 중에서 보고 선택했습니다. 다만, 파이썬 기초가 있으신 분들이 보시면 좋은 책 같습니다.

문장수집 (0)

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여주는 교보문고의 새로운 서비스입니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 "좋아요“ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보 없이 삭제될 수 있습니다.
리워드 안내
구매 후 90일 이내에 문장수집 작성 시 e교환권 100원을 적립해드립니다.
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)

구매 후 리뷰 작성 시, e교환권 100원 적립

이 책의 첫 기록을 남겨주세요.

교환/반품/품절 안내

  • 반품/교환방법

    마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환 신청, [1:1 상담 > 반품/교환/환불] 또는 고객센터 (1544-1900)
    * 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900)
  • 반품/교환가능 기간

    변심반품의 경우 수령 후 7일 이내,
    상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
  • 반품/교환비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 반품/교환 불가 사유

    1) 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
    2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
    3) 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
    4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
    5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
    6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
    7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
    8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
    9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등
  • 상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
  • 소비자 피해보상 환불 지연에 따른 배상

    1) 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
    2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

한강 스페셜 에디션
이벤트
  • sam x 한샘 [똑똑한sam]
  • 2025 1학기 대학교재전
01 / 02
TOP