R을 활용한 데이터 과학
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
로그아웃 : '서울시 종로구 종로1' 주소 기준
이달의 꽃과 함께 책을 받아보세요!
1권 구매 시 결제 단계에서 적용 가능합니다.
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
이 책은 R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 길잡이 책이다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로,데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명한다. 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요 도구들의 사용법도 상세히 설명하고 있어, 처음 R을 접하는 독자들도 이 도구들을 사용해, 데이터 과학을 빠르게 수행할 수 있도록 이끌어준다.
데이터 과학자로서 사고하고 문제 해결책을 찾아가는 로드맵
데이터 과학 프로젝트의 전 과정을 단계별로 나누어 각 장마다 예제로 시작한 다음, 각 절의 연습문제를 통해 학습한 내용을 확인할 수 있도록 짜여있어, 일련의 과정을 큰 그림으로 이해할 수 있게 돕는다. 이 책은 데이터 과학에 입문하는 이들에게는 훌륭한 안내서가, 이미 어느 정도 알고 있는 이들에게는 그 내용을 체계적으로 정리해 줄 핵심 활용서가 될 것이다.
이 책의 총서 (124)
작가정보
RStudio의 수석 과학자이자 R 재단의 회원이다. 데이터 과학 패키지(tidyverse, ggplot2, dplyr, tidyr, purr, readr)와 주요 소프트웨어(roxygen2, testthat, devtools)를 개발한 그는 데이터 과학을 더 쉽고 빠르며 재미있게 해주는 (프로그래밍 및 인지) 도구를 만들고 있다. 또한 저자, 교육자, 강연자로서 데이터 과학에 R 사용을 권장하며 활동하고 있다.
저자(글) 개럿 그롤문드
RStudio의 통계학자이자 교사이며 R 개발자이다. 인기 R 패키지 lubridate를 만들었으며 『Hands-On Programming with R』의 저자이다. 그의 교육 비디오 대부분은 oreilly.com/safari에서 볼 수 있다.
서울대학교 통계학과에서 학부와 석사를 마치고 미국 케이스웨스턴 대학에서 생물통계 전공으로 박사학위를 받았다. 현재는 네이버에서 데이터 과학 업무를 하고 있으며, 일할 때 R과 다른 도구를 활용하고 있다.
번역 최혜민
통계학을 전공하며 자연스레 R을 활용한 시각화와 프로그래밍에 관심을 두게 되었다. 현재는 SK텔레콤에서 데이터 분석 업무를 담당하고 있으며, 데이터에서 가치 있는 정보를 발굴하고 이를 활용할 수 있는 방안에 대해 고민하고 연구하고 있다.
목차
- 옮긴이의 말
서문
1부 탐색하기
1장 데이터 시각화
1.1 들어가기
1.2 첫 단계
1.3 심미성 매핑
1.4 자주 일어나는 문제들
1.5 facet
1.6 기하 객체
1.7 통계적 변환
1.8 위치 조정
1.9 좌표계
1.10 그래프 레이어 문법
2장 워크플로: 기초
2.1 코딩 기초
2.2 이름에 들어갈 것
2.3 함수 호출하기
3장 데이터 변형
3.1 들어가기
3.2 filter()로 행 필터링하기
3.3 arrange()로 행 정렬하기
3.4 select()로 열 선택하기
3.5 mutate()로 새로운 변수 추가하기
3.6 summarize()로 그룹화 요약하기
3.7 그룹화 뮤테이트(와 필터링)
4장 워크플로: 스크립트
4.1 코드 실행하기
4.2 RStudio 진단
5장 탐색적 데이터 분석
5.1 들어가기
5.2 질문하기
5.3 변동
5.4 결측값
5.5 공변동
5.6 패턴과 모델
5.7 ggplot2 표현
5.8 더 배우기
6장 워크플로: 프로젝트
6.1 무엇이 진짜인가?
6.2 분석 작업이 어디에 남아있는가?
6.3 경로와 디렉터리
6.4 RStudio 프로젝트
6.5 요약
2부 데이터 길들이기
7장 tibble로 하는 티블
7.1 들어가기
7.2 티블 생성하기
7.3 티블 vs 데이터프레임
7.4 이전 코드와 상호작용
8장 readr로 하는 데이터 불러오기
8.1 들어가기
8.2 시작하기
8.3 벡터 파싱하기
8.4 파일 파싱하기
8.5 파일에 쓰기
8.6 기타 데이터 유형
9장 tidyr로 하는 타이디 데이터
9.1 들어가기
9.2 타이디 데이터
9.3 Gather와 Spread
9.4 Separate와 Unite
9.5 결측값
9.6 사례연구
9.7 타이디하지 않은 데이터
10장 dplyr로 하는 관계형 데이터
10.1 들어가기
10.2 nycflights13
10.3 키
10.4 뮤테이팅 조인
10.5 필터링 조인
10.6 조인 문제
10.7 집합 연산
11장 stringr로 하는 문자열
11.1 들어가기
11.2 문자열 기초
11.3 정규표현식을 이용한 패턴 매칭
11.4 도구
11.5 기타 패턴 유형
11.6 정규표현식의 기타 용도
11.7 stringi
12장 forcats로 하는 팩터형
12.1 들어가기
12.2 팩터형 생성하기
12.3 종합사회조사
12.4 팩터 순서 수정하기
12.5 팩터 레벨 수정하기
13장 lubridate로 하는 날짜와 시간
13.1 들어가기
13.2 날짜/시간 생성
13.3 데이트-타임형 구성요소
13.4 시간 범위
13.5 시간대
3부 프로그램
14장 magrittr로 하는 파이프
14.1 들어가기
14.2 파이프 대안
14.3 파이프를 사용하지 않아야 할 경우
14.4 magrittr의 기타 도구
15장 함수
15.1 들어가기
15.2 함수를 언제 작성해야 하나?
15.3 함수는 사람과 컴퓨터를 위한 것
15.4 조건부 실행
15.5 함수 인수
15.6 반환값
15.7 환경
16장 벡터
16.1 들어가기
16.2 벡터의 기초
16.3 원자 벡터의 주요 유형
16.4 원자 벡터 이용하기
16.5 재귀 벡터(리스트)
16.6 속성
16.7 확장 벡터
17장 purrr로 하는 반복작업
17.1 들어가기
17.2 For 루프
17.3 For 루프 변형
17.4 For 루프 vs 함수형
17.5 맵 함수
17.6 실패 다루기
17.7 다중 인수로 매핑
17.8 워크
17.9 For 루프의 기타 패턴
4부 모델
18장 modelr을 이용한 모델의 기초
18.1 들어가기
18.2 간단한 모델
18.3 모델 시각화하기
18.4 수식과 모델 모음
18.5 결측값
18.6 다른 모델 모음
19장 모델 생성
19.1 들어가기
19.2 낮은 품질의 다이아몬드가 더 비싼 이유는 무엇인가?
19.3 일일 운항 횟수에 어떤 영향이 있는가?
19.4 모델에 대해 더 학습하기
20장 purrr와 broom을 이용한 많은 모델
20.1 들어가기
20.2 gapminder 데이터
20.3 리스트-열(List-column)
20.4 리스트-열 생성하기
20.5 리스트-열 단순화하기
20.6 broom으로 타이디 데이터 만들기
5부 의사소통
21장 R 마크다운
21.1 들어가기
21.2 R 마크다운 기초
21.3 마크다운으로 텍스트 서식 지정하기
21.4 코드 청크
21.5 문제 해결
21.6 YAML 헤더
21.7 더 배우기
22장 그래프를 통한 의사소통
22.1 들어가기
22.2 라벨
22.3 주석
22.4 스케일
22.5 확대ㆍ축소
22.6 테마
22.7 플롯 저장하기
22.8 더 배우기
23장 R 마크다운 유형들
23.1 들어가기
23.2 출력 옵션
23.3 문서
23.4 노트북
23.5 프리젠테이션
23.6 대시보드
23.7 대화형 동작
23.8 웹사이트
23.9 기타 유형
23.10 더 배우기
24장 R 마크다운 워크플로
찾아보기
추천사
-
“해들리 위컴은 이전에 아무도 생각하지 못했던 완전히 새로운 데이터 분석 방법을 개발한 데이터 과학 분야의 전설이다. 개럿 그롤문드와 함께한 이 책은 데이터 과학의 새로운 접근법을 체계화하여, 모든 세대의 데이터 분석가들에게 바이블 같은 역할을 할 것이다.”
[추천관계-존스 홉킨스 블룸버그 공중보건대학 생물통계학 교수] -
“해들리 위컴은 2010년대 중반에 현대적인 데이터 분석을 위한 tidyverse 패키지 개발에 핵심적인 역할을 한, R 사용자들의 영웅이다. 그가 이 책에서 개괄한 R 데이터 분석 워크플로와 모범 사례는 초?중?고급 사용자 모두가 참고할 수 있는 내용이다. R 실무자들의 일독을 권한다.”
[추천관계-『따라 하며 배우는 데이터 과학』 저자]
출판사 서평
* 이 책에서 다루는 내용
- 길들이기: 데이터셋을 분석에 편리한 방식으로 변형하기
- 프로그래밍: 데이터 분석 문제를 더 쉽고 명확하게 해결할 수 있는 강력한 R 도구 습득하기
- 탐색하기: 데이터를 탐색하고 가설을 생성하여 빠르게 테스트하기
- 모델링: 데이터셋에서 실제 ‘신호’를 포착하는 저차원의 요약 제공하기
- 의사소통: 설명글, 코드, 결과를 통합하는 R Markdown 배우기
기본정보
ISBN | 9788966262359 | ||
---|---|---|---|
발행(출시)일자 | 2019년 01월 10일 | ||
쪽수 | 495쪽 | ||
크기 |
188 * 241
* 30
mm
/ 940 g
|
||
총권수 | 1권 | ||
시리즈명 |
프로그래밍 인사이트
|
Klover 리뷰 (11)
구매 후 리뷰 작성 시, e교환권 200원 적립
사용자 총점
33%의 구매자가
추천해요 라고 응답했어요
집중돼요
도움돼요
쉬웠어요
최고예요
추천해요
문장수집 (5)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)
기분 좋은 발견
이 분야의 베스트
이 분야의 신간
-
이재호 교수의 사고력 코딩 데이터 사이언스 전문가23,000 원
-
처음이지만 프로처럼 쓰는 Notion10% 19,800 원
-
2025 단·축·키 빅데이터 분석기사 실기(파이썬 작업형)10% 27,000 원
-
ChatGPT와 함께 하는 데이터 분석 기행33,000 원
-
첫 번째 논문 통계21,000 원
(데이터 로드, 정리, 변형, 시각화, 모델링)
- 해들리 위컴, 그롤문드-
데이터 분석 역량의 세축은
프로그램을 활요한 데이터 처리역량, 해박한 머신러닝 지식, 탁월한 분석과정 기획이 아닐까 합니다
이 책은 데이터 분석역량중 가장 기본이 되는 데이터 처리역량을 향상시킬 수 있는 책입니다
책은 5부로 구성이 되어,
탐색하기, 데이터 길들이기, 프로그램, 모델, 의사소통을 전반적으로 학습합니다
저자의 탁월한 실력과 많은 분석경험 및 tip이 책 곳곳에 녹아있어, 실무에 적용이 필요한 독자에게 유용하리라 생각합니다
옥의 티는 일부 패키지 및 함수(예 purrr)에 오타가 있습니다