초보자를 위한 데이터 사이언스 입문 데이터 R지?
없습니다
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
로그아웃 : '서울시 종로구 종로1' 주소 기준
이달의 꽃과 함께 책을 받아보세요!
1권 구매 시 결제 단계에서 적용 가능합니다.
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
그리고 IT 비전공자들도 익숙한 MS 오피스 프로그램인 엑셀을 통해 데이터를 분석 가공해서 문제를 해결할 수 있도록 기본적인 내용으로 구성하였고 엑셀만으로 부족한 부분을 채울 수 있도록 프로그래밍 기반의 R을 중심으로 구성되어 있습니다.
R, RStudio를 중심으로 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요도구들의 사용법도 상세히 설명하고 있어 처음 R을 접하는 독자들도 데이터 과학을 빠르게 수행할 수 있도록 이끌어 주는 역할을 합니다.
작가정보
교수
동서대학교 소프트웨어융합대학 교수로 재직 중이며, 현재 컴퓨터공학 개론과 SW 기초와 관련한 강의를 진행하고 있다. 최근에는 SW중심대학사업단에서 비전공자들을 위한 AI·SW 교육 및 연구를 진행하고 있다.
목차
- CHAPTER 1 데이터 사이언스 001
■ 1.1 데이터란 무엇인가? 002
1.1.1 데이터(Data)와 정보(Information) 002
1.1.2 자료, 정보, 지식, 지혜의 사이클 004
1.1.3 데이터 유형 005
1.1.4 데이터 크기 007
■ 1.2 데이터 사이언스란? 008
1.2.1 데이터 사이언스 정의 008
1.2.2 데이터 사이언티스트(Data Scientist) 010
1.2.3 데이터 분석 VS 데이터 사이언스 011
■ 1.3 데이터 사이언스 절차 012
■ 1.4 데이터 사이언스를 위한 소프트웨어 014
CHAPTER 2 빅데이터 기술의 이해 017
■ 2.1 빅데이터란? 018
2.1.1 빅데이터란 정확히 무엇일까요? 018
2.1.2 빅데이터의 3V 021
2.1.3 빅데이터의 부상 021
■ 2.2 빅데이터 분석 023
■ 2.3 빅데이터 활용 024
■ 2.4 빅데이터 시대의 빅브라더 등장 026
CHAPTER 3 엑셀로 데이터 맛보기 029
■ 3.1 엑셀 몰아보기 030
3.1.1 엑셀 화면 구성 030
3.1.2 데이터 입력 033
3.1.3 파일 저장 034
3.1.4 파일 열기 035
■ 3.2 워크시트와 자동 서식 035
3.2.1 삽입과 삭제 035
3.2.2 이동과 복사 037
3.2.3 미리 만들어진 서식으로 문서 만들기 040
CHAPTER 4 엑셀로 데이터 정리하기 041
■ 4.1 데이터 채우기 042
4.1.1 자동 채우기 042
4.1.2 빠른 채우기 045
■ 4.2 데이터 유효성 검사하기 046
4.2.1 데이터 유효성 검사 기능 046
4.2.2 유효성 조건 설정 046
■ 4.3 중복데이터 정리하기 050
■ 4.4 셀 꾸미기 051
4.4.1 셀 서식 051
4.4.2 셀 스타일과 표 서식 056
4.4.3 메모 058
4.4.4 행과 열 크기 설정 060
■ 4.5 기본함수 익히기 061
4.5.1 함수란? 061
4.5.2 셀 참조 하기 062
4.5.3 자동 합계 기능 064
4.5.4 함수 라이브러리와 함수 마법사 068
CHAPTER 5 엑셀로 데이터 고급지게 정리하기 071
■ 5.1 조건부 서식 072
5.1.1 셀 강조 규칙과 상위/하위 규칙 072
5.1.2 데이터 막대/색조/아이콘 집합 074
5.1.3 수식을 사용한 조건부 서식 076
5.1.4 규칙 관리 077
■ 5.2 차트 080
5.2.1 차트의 구성 요소 080
5.2.2 차트 만들기 081
5.2.3 차트 편집 085
5.2.4 스파크라인 차트 088
CHAPTER 6 엑셀로 데이터 관리하기 091
■ 6.1 데이터 정렬하기 092
6.1.1 정렬의 기본 092
6.1.2 데이터 값으로 정렬 093
6.1.3 서식으로 정렬 095
■ 6.2 데이터 추출하기 097
6.2.1 자동 필터 097
6.2.2 고급 필터 103
■ 6.3 피벗테이블 106
6.3.1 피벗테이블 만들기 106
6.3.2 피벗테이블 편집 108
6.3.3 슬라이서 및 데이터 필터링 116
CHAPTER 7 종합 예제 119
■ 7.1 시간대별 풍력 발전량 120
■ 7.2 졸업 과정과 급여의 관계 129
CHAPTER 8 빅데이터 어떻게 다룰까? 135
■ 8.1 R이란? 136
■ 8.2 R과 RStudio 환경구축 136
8.2.1 R 다운로드 및 설치 137
8.2.2 R GUI 실행 140
8.2.3 R Studio 다운로드 및 설치 141
8.2.4 RStudio 실행 환경 143
■ 8.3 R과 RStudio 다루기 147
8.3.1 RStudio에서 프로젝트 생성하기 147
8.3.2 RStudio 스크립트 저장 150
8.3.3 R Studio 스크립트 생성 152
8.3.4 함수와 패키지 153
CHAPTER 9 데이터 구조 157
■ 9.1 데이터 구조와 연산 158
9.1.1 변수 158
9.1.2 벡터 163
9.1.3 팩터(factor) 174
9.1.4 행렬 175
9.1.5 리스트 183
9.1.6 데이터 프레임 187
■ 9.2 데이터 읽고 쓰기 201
9.2.1 파일 저장하기 201
9.2.2 파일 불러오기 202
9.2.3 R 내장 데이터 읽기 206
■ 9.3 데이터 정제하기 208
9.3.1 데이터 추출 209
9.3.2 일괄 처리하기 212
9.3.3 NA 처리하기 218
9.3.4 이상치 정제하기 220
CHAPTER 10 데이터 시각화해 봤니? 223
■ 10.1 데이터 시각화란? 224
■ 10.2 ggplot2 사용하기 225
■ 10.3 히스토그램 227
■ 10.4 밀도 도표 228
■ 10.5 상자 도표 230
■ 10.6 산점도 233
■ 10.7 바 차트(Bar Chart) 235
CHAPTER 11 누가 생존했을까? 239
■ 11.1 Kaggle? 240
■ 11.2 Titanic Dataset 240
■ 11.3 데이터 수집 240
■ 11.4 데이터 살펴보기 241
11.4.1 새 프로젝트 생성 241
11.4.2 새 스크립트 파일 생성 242
11.4.3 파일 불러오기 242
11.4.4 데이터 살펴보기 243
11.4.5 데이터 요약 245
■ 11.5 데이터 정제하기 245
■ 11.6 데이터 시각화하기 248
CHAPTER 12 사람들은 어디로 많이 갔을까? 257
■ 12.1 SK Data Hub 258
■ 12.2 데이터 수집 258
■ 12.3 데이터 살펴보기 259
■ 12.4 데이터 정제하기 262
■ 12.5 데이터 시각화하기 265
CHAPTER 13
CHAPTER 13 우리나라 인구는 어떻게 변했을까? 273
■ 13.1 공공데이터 274
■ 13.2 데이터 수집 274
■ 13.3 데이터 살펴보기 276
■ 13.4 데이터 정제하기 279
■ 13.5 데이터 시각화하기 284
CHAPTER 14 어떤 단어들이 많이 등장했을까? 289
■ 14.1 비정형 데이터 290
■ 14.2 데이터 수집 290
■ 14.3 데이터 살펴보기 295
■ 14.4 데이터 정제하기 297
■ 14.5 텍스트 정형화하기 300
■ 14.6 데이터 시각화하기 304
CHAPTER 15 웹데이터 가져오기? 307
■ 15.1 웹 스크래핑? 308
■ 15.2 데이터 수집 308
■ 15.3 데이터 살펴보기 310
■ 15.4 데이터 정제하기 314
■ 15.5 데이터 시각화하기 319
INDEX 321
책 속으로
우리는 다양한 종류의 디지털 소스로부터 매일같이 수많은 데이터가 쏟아져나오는 빅데이터 시대를 살아가고 있습니다. 앞으로 우리가 직면하게 될 4차 산업혁명 시대는 초연결성, 초지능성 사회를 지향하고 있습니다. 4차 산업혁명의 핵심 기술 중의 하나로 지목되고 있는 사물인터넷 기술로 인해 우리가 접하게 될 데이터의 크기와 종류는 더 크고 광범위해질 것으로 여겨집니다. 이것은 우리가 앞으로 다루게 될 데이터가 점차 기존의 데이터 관리 소프트웨어의 한계를 넘어선다는 것을 의미합니다. 그렇다면 어떻게 빅데이터를 다룰 수 있을까요? 이 책에서는 프로그래밍 언어 R을 소개합니다.
8.1 R이란?
R은 통계 및 그래픽을 위한 프로그래밍 언어입니다. 소프트웨어 개발을 위한 언어라기보다는 데이터를 분석하고 시각화하는 데 최적화된 언어라고 할 수 있습니다. R은 1990년대 초 뉴질랜드 오클랜드 대학의 로버트 젠틀맨과 로스 이하카에 의해 통계처리를 목적으로 개발되었지만, 그 응용분야가 점차 데이터마이닝, 머신러닝 등으로 확장되었습니다. R의 큰 장점은 오픈소스 언어이기 때문에 누구나 무료로 이용할 수 있다는 점입니다. 또한 인터프리터 언어로 컴파일 과정을 거치지 않아 분석 과정이 비교적 간결하며, 비전공자도 쉽게 배울 수 있다는 장점이 있습니다. 이러한 이유로 R은 빅데이터 시대에 여러 다양한 분
야의 데이터 분석가들로부터 사랑을 받고 있습니다.
데이터 분석은 데이터를 수집하고, 데이터를 정제하고, 데이터를 시각화하고, 여러가지 분석 방법을 통해 분석하는 과정을 거쳐 데이터 안에 숨어있는 정보를 찾습니다. 우리는 R을 통해 데이터를 수집하는 방법과 데이터를 분석하기 전에 전처리하고 시각화 하는 방법에 대해 공부하려고 합니다.
8.2 R과 RStudio 환경구축
본격적으로 R을 다루기 위해서는 먼저 PC에 R과 RStudio를 설치해줘야 합니다. RStudio는 R을 사용하여 프로그램 작업을 편하게 할 수 있도록 도와주는 통합개발환경(Integrated Development Environments: IDE) 입니다. R과 RStudio는 인터넷상에서 무료로 다운받을 수 있습니다. 먼저 R을 다운로드하고 설치해봅시다.
기본정보
ISBN | 9791188831708 |
---|---|
발행(출시)일자 | 2020년 12월 27일 |
쪽수 | 328쪽 |
크기 |
189 * 258
* 15
mm
/ 711 g
|
총권수 | 1권 |
Klover 리뷰 (0)
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집 (0)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)
기분 좋은 발견
이 분야의 베스트
이 분야의 신간
-
SPSS를 활용한 중급 통계분석10,000 원
-
LLM 빅데이터 레볼루션10% 22,500 원
-
이재호 교수의 사고력 코딩 데이터 사이언스 전문가23,000 원
-
처음이지만 프로처럼 쓰는 Notion10% 19,800 원
-
2025 단·축·키 빅데이터 분석기사 실기(파이썬 작업형)10% 27,000 원