Must Have 나성호의 R 데이터 분석 입문
도서+교보Only(교보배송)을 함께 15,000원 이상 구매 시 무료배송
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

저자는 패스트캠퍼스/러닝스픈즈/멀티캠퍼스를 비롯해 유수의 기업에서 데이터 분석 강의를 진행한 명강사입니다. 강의를 하며 1. 수강생은 바쁘다 2. 바쁘다는 이유로 자료 구조를 건너뛰고 무작정 데이터 분석부터 배우면 3. 데이터 분석을 제대로 익히지 못한다는 사실을 알아냈습니다.
그래서 이 책을 준비했습니다. 1. 한 권으로 2. 특히 데이터 분석 핵심인 자료 구조를 자유자재로 다룰 수 있게 중점적으로 설명하고 3. 데이터 분석 전과정을 체험하게 구성했습니다. 단순히 명령어 사용법만 안다고 데이터 분석을 할 수는 없습니다. 실제 현장에서 만나게 되는 다양한 경우에 맞춰 활용하는 방법을 알아야 합니다.
반드시 데이터 분석을 제대로 익히고 싶은 분이라면 17년간 데이터 분석가로, 3년간 강사로 활약한 저자가 제시하는 학습 방법을 따라 책에 담긴 데이터 분석 노하우도 모두 챙겨가기 바랍니다. 잊지 마세요, 자료구조가 핵심이고 먼저입니다.
★ Must Have 시리즈 안내
Must Have 시리즈는 내 것으로 만드는 시간을 드립니다. 명확한 학습 목표와 핵심 정리를 제공하고, 간단명료한 설명과 다양한 그림으로 학습 효과를 극대화합니다. 예제를 제공해 응용력을 키워줍니다. 할 수 있습니다. 포기는 없습니다. 지금 당장 밑줄 긋고 메모하고 타이핑하세요! Must Have가 여러분의 성장을 돕겠습니다.
작가정보
삼성화재 CRM 파트에서 직장생활을 시작하여 현대캐피탈, 하나카드, 하나금융경영연구소 등 다양한 금융회사에서 데이터 분석을 직접 수행하는 마케터이자 연구원으로 근무했습니다.
패스트캠퍼스 전임강사로 〈R을 활용한 웹 크롤링〉과 〈R School〉을, 멀티캠퍼스에서 〈R을 활용한 데이터 분석〉, 러닝스푼즈 나노디그리 과정에서 〈R을 활용한 데이터 분석〉을 강의했습니다. 현재는 R과 파이썬으로 데이터 수집(웹 크롤링), 전처리, 시각화, 통계 분석 및 머신러닝을 주제로 여러 기업에서 강의를 하고 있습니다. 2020년 말에 박사 과정을 수료하여 졸업을 눈앞에 두고 있습니다.
저역서
● 《효율적인 R 프로그래밍》 공역
● 《포워드 2019 미래를 읽다》 공저
목차
- 00 실습 환경 구축
[1단계] R 자료구조 : 자료구조가 핵심이다. 잘 다뤄야 분석이 쉽다
01장 데이터 분석 입문
__1.1 R 기초 지식
__1.2 생애 첫 R 프로그래밍 : Hello World
__1.3 스크립트창에서 코드 실행하기
__1.4 프로젝트 생성하기
__1.5 R 객체의 특징
__1.6 R 자료구조 종류
__학습 마무리
02장 자료구조 : 벡터
__2.1 R 자료형과 벡터의 특징
__2.2 벡터 생성
__2.3 벡터 원소 선택
__2.4 벡터 원소 추가
__2.5 벡터 원소 삭제
__2.6 벡터 원소 변경
__2.7 벡터 형변환
__2.8 벡터 강제변환
__2.9 산술 연산자
__2.10 비교 연산자
__2.11 논리 연산자
__2.12 멤버 연산자 : %in%
__학습 마무리
03장 자료구조 : 리스트 093
__3.1 리스트 특징
__3.2 리스트 생성
__3.3 리스트 원소 선택
__3.4 리스트 원소 추가
__3.5 리스트 원소 삭제
__3.6 리스트 원소 변경
__학습 마무리
04장 자료구조 : 데이터프레임 103
__4.1 데이터프레임 특징
__4.2 데이터프레임 생성
__4.3 데이터프레임 원소 선택
__4.4 데이터프레임 원소 추가
__4.5 데이터프레임 원소 삭제
__4.6 데이터프레임 원소 변경
__학습 마무리
[2단계] R 프로그래밍 : 프로그래밍을 알아야 효과적으로 분석한다
05장 조건문
__ 05 조건문
__5.1 if문 기본 구조
__5.3 ifelse() 함수
__학습 마무리
06장 반복문
__6.1 for문
__6.2 while문
__6.3 이후 코드 건너뛰기 : next
__6.4 반복문 탈출하기 : break
__학습 마무리
07장 사용자 정의 함수
__7.1 왜 사용자 정의 함수가 필요할까?
__7.2 사용자 정의 함수의 기본 구조
__7.3 사용자 정의 함수 생성
__7.4 파일로 저장한 사용자 정의 함수 재활용
__7.5 인수의 기본값 설정
__학습 마무리
08장 같은 함수 반복 실행
__8.1 벡터를 넣어 반복 실행하는 함수 : apply()
__8.2 for문과 비교
__8.3 원소를 넣어 반복 실행하는 함수 : lapply()와 sapply()
__8.4 FUN에 사용자 정의 함수 사용하기
__학습 마무리
[3단계] R 데이터 분석 : 아파트 실거래 데이터로 실전처럼 익히자
09장 데이터 입출력
__9.1 사전 지식 : tidyverse 패키지
__9.2 작업 경로 확인 및 변경
__9.3 엑셀 파일 입출력
__9.4 텍스트 파일 입출력 : csv파일, txt 파일
__9.5 RDS 파일 입출력
__9.6 RDA 파일 입출력
__학습 마무리
10장 오픈 API를 활용한 공공데이터 수집과 처리
__10.1 사전 지식 : API
__10.2 STEP 1 공공데이터포털 오픈 API 활용하기
__10.3 STEP 2 기술문서 읽기
__10.4 STEP 3 데이터 가져오기
__10.5 STEP 4 데이터 처리하기
__학습 마무리
11장 데이터프레임 전처리
__11.1 사전 지식 : dplyr 패키지
__11.2 STEP 1 실습 데이터셋 준비
__11.3 STEP 2 컬럼 선택 및 삭제
__11.4 STEP 3 컬럼명 변경
__11.5 STEP 4 조건에 맞는 행 선택(필터링)
__11.6 STEP 5 인덱스로 행 선택 및 삭제
__11.7 STEP 6 컬럼의 자료형 변환
__11.8 STEP 7 기존 컬럼 변경 및 새로운 컬럼 생성
__11.9 STEP 8 집계 함수로 데이터 요약
__11.10 STEP 9 데이터프레임 형태 변환
__11.11 STEP 10 오름차순 및 내림차순 정렬
__학습 마무리
12장 데이터프레임 병합
__12.1 데이터프레임 병합
__12.2 STEP 1 실습 데이터셋 준비
__12.3 STEP 2 외래키 확인 및 전처리
__12.4 STEP 3 외래키 중복 여부 확인
__12.5 STEP 4 데이터프레임 병합 실습
__학습 마무리
13장 기술통계 분석
__13.1 기술통계량 : 대푯값, 산포, 선형관계
__13.2 실습 데이터셋 준비
__13.3 대푯값 : 평균, 절사평균, 중위수, 백분위수, 사분위수
__13.4 산포 : 최솟값, 최댓값, 범위, 사분범위, 분산, 표준편차
__13.5 선형관계 : 공분산, 상관계수
__학습 마무리
14장 데이터 시각화 : ggplot2 패키지
__14.1 사전 지식 : ggplot2 패키지
__14.2 시각화
__14.3 실습 데이터셋 준비 및 폰트 추가
__14.4 히스토그램 시각화
__14.5 상자 수염 그림 시각화
__14.6 막대 그래프 시각화
__14.7 선 그래프 시각화
__14.8 산점도 시각화
__학습 마무리
추천사
-
데이터 분석을 시작하면서 가장 어려운 점은 ‘뭘 모르는지 모르는 상태’에서 벗어나는 겁니다. 이 책은 데이터 분석 입문자가 최단 경로로 ‘뭘 모르는지 모르는 상태’에서 빠져나갈 수 있도록 도와주는 북극성 역할을 해줍니다.
-
프로그래밍을 배우고 싶지만, 다른 언어는 진입장벽이 높아 보인다면 이 책을 추천합니다. 깊이 있는 프로그래밍 지식이 없더라도, 쉽게 따라 할 수 있는 예제를 반복하다 보면 어느새 ‘나도 데이터 분석을 할 수 있다’는 자신감을 갖게 될 겁니다.
-
처음 R을 접하면서 만나게 될 자료구조와 문법을 쉽게 설명했습니다. 기존에 프로그래밍 경험이 있는 분이라면 저자가 풀어놓은 쉽고 명괘한 설명이 쉽게 이해될 겁니다. 실무에서 자주 사용하는 예제에 많은 지면을 할애했기 때문에 실제 데이터 분석 업무에 R을 어떻게 적용하는지 간접 체험하고, 향후 더 공부할 방향을 찾는 길잡이가 되어줄 겁니다.
-
R 프로그래밍 기초를 자세히 설명하는 책입니다. 데이터 분석을 시작하기 전 R 기본기를 갖추려는 분에게 추천합니다. 장마다 핵심 요약이 제공되어 정말 유용합니다.
-
R은 SAS나 SPSS와 달리 오프소스이며 프로그래밍의 자유도가 높은 장점이 있지만, 익숙해지기까지 많은 노력이 필요하고, 사소한 실수에도 에러가 발생합니다. 저자는 R을 처음 접하는 사람도 하나씩 따라 할 수 있도록 기초부터 친절히 설명합니다. 이 책으로 핵심 내용을 익히고 점차 자신에게 맞는 패키지, 함수, 방법을 익혀나가면 통계분석 전문가로 성장할 수 있을 겁니다.
-
이 책은 명확한 학습 목표를 설정하고 개념과 코드를 체계적으로 그리고 적절한 분량으로 설명합니다. 장마다 끝에 요약 정보를 제시하여 방대한 내용을 다시 상기시켜줍니다. 데이터 분석은 결국 본인의 업무에 따라 활용도가 다를 수밖에 없습니다. 이 책으로 기본을 익힌 다음, 더 고급 내용까지 배우면 R을 이용한 데이터 분석에서 자신감이 생길 겁니다.
출판사 서평
★ 데이터 분석을 잘하려면 자료구조와 프로그래밍의 기본을 잘 알아야 합니다.
데이터 분석에 능숙하고 싶습니까? 그렇다면 자료구조를 먼저 탄탄히 익혀야 합니다. 데이터 분석 과정은 데이터를 다양한 형태로 바꾸며 진행되기 때문입니다. 그래서 이 책은 먼저 자료구조를 탄탄히 익히고 나서 R 프로그래밍, 데이터 수집, 전처리, 기술통계 분석, 시각화를 설명합니다.
엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다. 국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보 4천 여건을 직접 수집해 활용합니다.
17년간 데이터 분석가로서, 3년간 강사로서 활동하며 깨달은 ’고급 분석가로 가기 전에 이 정도는 알아야 하는 내용’을 충실히 담았습니다. 데이터 분석가를 꿈꾸는 대학생과 취업 준비생은 물론 데이터 분석가로 직무 전환을 바라는 직장인이 한 권으로 R 입문과 데이터 분석 전반을 체험하고 익힐 수 있도록 구성했습니다.
[숫자로 보는 책의 특징]
_0 아무것도 몰라도 OK
R을 몰라도 됩니다. R 입문과 데이터 분석 입문 과정 모두를 알려줍니다.
_3 단계로 익히는 R 데이터 분석
1단계에서 R 자료구조, 2단계에서 프로그래밍, 3단계에서 데이터 분석(수집, 전처리, 기술 통계, 시각화)을 차례대로 배웁니다.
_3가지 OS별 개발 환경 구축
윈도우, 맥OS, 리눅스 개발 환경 구성 방법을 모두 제시합니다.
_4가지 데이터 입출력 형식
엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 이 4가지 형식으로 입출력을 자유자재로 할 줄 알면 데이터 관리가 훨씬 수월해집니다.
_5가지 데이터 시각화 그래프 학습
데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다.
_4000여건 아파트 매매 데이터
국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보 4천 여건을 직접 수집해 활용합니다.
[대상 독자]
- R 데이터 분석 입문자
- 데이터를 다루는 업무 관련 취업 희망자
- 데이터 분석 업무에 R을 적용하고 싶은 직장인
[저자와 4문 4답]
R과 데이터 분석 초보자에게 전하고 싶은 말씀이 있으신가요?
아주 당연한 얘기지만 ‘세상에 공짜는 없다’라는 말씀을 드리고 싶습니다. R과 파이썬으로 데이터 분석 강의를 판매하는 일부 기관이나 업체에서 ‘R과 파이썬 데이터 분석은 쉽다’라는 허위 광고를 수 년째 하고 있습니다. 프로그래밍도 모르고 데이터 분석도 모르는 입문자에게 자칫 불필요한 오해를 심어주고 있습니다. R과 파이썬 데이터 분석은 절대로 쉽지 않습니다. 새로운 언어를 배워야 하기 때문에 익숙해지려면 수개월에서 수년이 걸립니다. 그러다 보니 프로그래밍과 데이터 분석에 도전했다가 내 길이 아닌가 싶어서 금세 포기하는 분이 많습니다.
프로그래밍과 데이터 분석을 꾸준하게 학습할 수 있도록 스스로 동기부여하고 환경을 조성해야 합니다. 가장 좋은 방법은 학습자 본인이 가장 좋아하는 분야를 찾고, 그 분야의 데이터를 분석해보는 겁니다. 예를 들어 야구를 좋아하는 사람은 야구 데이터를 분석하고, 영화를 좋아하는 사람은 영화 데이터를 분석하는 겁니다. 최근 주식 거래 붐이 일고 있으므로 주식 데이터를 분석하여 돈을 벌 수 있는 투자 전략을 수립하고, 자동매매 프로그래밍에 도전하는 것도 아주 좋은 동기부여가 될 것이라고 생각합니다.
R이 얼마나 많이 사용되는 거죠?
R은 프로그래밍 언어 랭킹에서 2020년에 8위 2021년 8월에 14위를 차지했습니다
(tiobe.com). R은 통계학자가 통계 분석을 위해 만든 언어이므로 통계 분석에 사용합니다. 파이썬과 함께 데이터 분석 핵심 언어로 사용되고 있습니다.
R이 데이터 분석에 많이 사용되는 이유가 있나요?
R은 통계학자가 통계 분석을 목적으로 만든 프로그래밍 언어입니다. 그래서 통계 분석에 특화되어 있습니다. 아울러 데이터 전처리에 유용한 dplyr 패키지와 데이터 시각화에 강점을 갖는 ggplot2 패키지가 있다는 장점이 있습니다. 그리고 웹 크롤링이라든가 Shiny1를 활용해 대시보드 개발도 가능합니다.
엑셀, R, 파이썬 데이터 분석의 장단점이 궁금합니다.
엑셀은 사용자 친화적인 프로그램이라서 많은 직장인이 데이터 분석에 사용합니다. 그런데 엑셀은 셀마다 함수를 생성하는 방식으로 처리해야 하므로 대용량 데이터를 다루기에 한계가 있습니다. 고급 통계 분석도 사용하기 어렵습니다. 하지만 R과 파이썬으로 엑셀의 한계를 해결할 수 있습니다. 고급 통계 분석은 물론 머신러닝과 딥러닝, 텍스트 마이닝까지 수행할 수 있기 때문입니다. 다만 R과 파이썬을 잘 다루려면 키보드로 프로그래밍하는 방법에 익숙해질 필요가 있습니다.
R과 파이썬 둘 중에 어떤 것을 배울 것인지 고르는 기준은 저마다 다르겠지만, 보통 프로그래밍 언어에 익숙한 개발자라면 파이썬이 좋고, 프로그래밍 언어가 처음인 비개발자라면 R이 좋습니다. 아무래도 인덱스가 0부터 시작하는 파이썬보다는 1부터 시작하는 R이 조금 더 인간다운 언어처럼 보이기 때문일 겁니다.
[이 책의 구성]
이 책은 먼저 자료구조를 탄탄히 익히고 나서 R 프로그래밍, 데이터 수집, 전처리, 기술통계 분석, 시각화를 설명합니다.
_00장 실습 환경 구축
[1단계 R 자료구조 : 자료구조가 핵심이다. 잘 다뤄야 분석이 쉽다]
자료형과 자료구조에 익숙해집시다. 구글링으로 발견한 코드를 자신의 데이터에 적용할 때 에러가 발생하고, 문제를 해결하지 못하는 이유는 자료형과 자료구조에 대한 이해가 부족하기 때문입니다. 데이터를 담는 그릇인 자료구조를 알아야 데이터를 제대로 다룰 수 있습니다.
_1장 R 데이터 분석 입문
생애 첫 R 프로그램을 만들고, 코드를 실행하고 프로젝트를 생성하는 방법을 알아봅니다. R 기본 구문과 객체도 알아보며 기본을 다집니다. 무협지 무림 고수가 기초 체력부터 다진 후 화려한 기술을 익히듯이, 코딩 고수를 목표로 기초부터 제대로 익히는 시간이 될 겁니다.
_2장 자료구조 : 벡터
R에서 가장 기본이 되는 자료구조인 벡터를 알아봅시다. 벡터는 같은 자료형을 원소로 갖는 자료구조이며, 나중에 학습할 리스트와 데이터프레임의 원소로 사용됩니다.
_3장 자료구조 : 리스트
R에서 광범위하게 사용되는 자료구조인 리스트를 알아봅시다. 리스트의 구조를 확인하고, 필요한 원소만 선택하는 인덱싱 방법에 중점을 두어 학습하기 바랍니다.
_4장 자료구조 : 데이터프레임
데이터프레임을 학습합니다. R은 엑셀 문서인 xls, xlsx 파일이나 텍스트 문서인 csv 파일을 데이터프레임으로 생성합니다. R을 이용한 데이터 분석에서 데이터프레임을 가장 많이 다루게 됩니다. 따라서 데이터프레임의 원소를 선택하는 인덱싱 방법, 원소를 추가, 삭제, 변경하는 전처리 방법에 중점을 두어 학습하겠습니다.
[2단계 R 프로그래밍 : 프로그래밍을 알아야 효과적으로 분석한다]
R 프로그래밍에 사용하는 조건문, 반복문, 사용자 정의 함수, 같은 함수 반복 실행 방법을 알아봅니다. 낯설고, 어렵고, 재미없고, 지루하지만 기초 체력이 충분해야 고급 스킬을 구사할 수 있다는 믿음으로 꾸준하게 학습하기 바랍니다.
_5장 조건문
코드가 실행되는 흐름을 분기하는 if문 사용법을 알아봅시다.
_6장 반복문
R 프로그래밍에 자주 사용하는 반복문을 알아보겠습니다. 반복문은 어떤 코드에서 일부의 값을 바꿔가면서 반복하여 실행할 때 사용됩니다.
_7장 사용자 정의 함수
R 함수로 제공되지 않지만 분석가 자신이 자주 사용하는 함수(사용자 정의 함수)를 직접 만드는 방법을 알아보겠습니다.
_8장 같은 함수 반복 실행
같은 함수를 반복 실행할 때 사용하는 apply() 함수 활용법을 알아보겠습니다.
[3단계 R 데이터 분석 : 아파트 실거래 데이터로 실전처럼 익히자]
데이터를 수집하고 전처리하고 시각화해 분석하는 방법을 알아봅시다. 엑셀 또는 CSV 파일을 읽고 R 데이터프레임으로 생성하고, 공공데이터포털에서 오픈 API로 공공데이터를 수집하는 방법에 익숙해지면 공공데이터포털에서 제공되는 모든 데이터가 다 내것이 됩니다. 데이터프레임을 자유자재로 다루면 업무 생산성이 높아집니다. 5가지 그래프까지 만들어보면 R로 데이터를 분석하는 전 과정을 마무리합시다.
_9장 데이터 입출력
엑셀 및 텍스트 파일을 R에서 불러오고 저장하는 방법을 알아보겠습니다.
_10장 오픈 API를 활용한 공공데이터 수집과 처리
공공데이터포털 오픈 API를 활용한 데이터 수집 방법을 알아보겠습니다.
_11장 데이터프레임 전처리
데이터 분석 과정에서 가장 많이 사용하는 자료구조인 데이터프레임을 전처리하는 방법을 알아보겠습니다.
_12장 데이터프레임 병합
두 개 이상의 데이터프레임을 하나로 합칠 때 병합하는 방법을 알아보겠습니다.
_13장 기술통계 분석
기술통계(descriptive statistics) 분석을 통해 데이터의 주요 특징을 빠르게 파악합니다.
_14장 데이터 시각화
ggplot2 패키지에서 제공하는 함수를 사용해 히스토그램, 상자 수염 그림, 막대 그래프, 선 그래프, 산점도 시각화 그래프를 그려서 데이터의 주요 특징을 시각화합니다.
기본정보
ISBN | 9791191905038 | ||
---|---|---|---|
발행(출시)일자 | 2021년 10월 15일 | ||
쪽수 | 300쪽 | ||
크기 |
185 * 235
* 18
mm
/ 553 g
|
||
총권수 | 1권 | ||
시리즈명 |
Must Have 시리즈
|
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립