본문 바로가기

추천 검색어

실시간 인기 검색어

초보자를 위한 데이터 사이언스 입문 데이터 R지?

초보자를 위한 데이터 사이언스 입문
배정수 , 황순욱 저자(글)
연두에디션 · 2020년 12월 27일
0.0
10점 중 0점
(0개의 리뷰)
평가된 감성태그가
없습니다
  • 데이터 R지? 대표 이미지
    데이터 R지? 대표 이미지
  • A4
    사이즈 비교
    210x297
    데이터 R지? 사이즈 비교 189x258
    단위 : mm
01 / 02
무료배송 이벤트 소득공제
22,000
적립/혜택
1,100P

기본적립

5% 적립 1,100P

추가적립

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 1,100P
  • 리뷰 작성 시, e교환권 추가 최대 300원
배송안내
무료배송
배송비 안내
국내도서/외국도서
도서 포함 15,000원 이상 구매 시 무료배송
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)

15,000원 미만 시 2,500원 배송비 부과

교보Only(교보배송)
각각 구매하거나 함께 20,000원 이상 구매 시 무료배송

20,000원 미만 시 2,500원 배송비 부과

해외주문 서양도서/해외주문 일본도서(교보배송)
각각 구매하거나 함께 15,000원 이상 구매 시 무료배송

15,000원 미만 시 2,500원 배송비 부과

업체배송 상품(전집, GIFT, 음반/DVD 등)
해당 상품 상세페이지 "배송비" 참고 (업체 별/판매자 별 무료배송 기준 다름)
바로드림 오늘배송
업체에서 별도 배송하여 1Box당 배송비 2,500원 부과

1Box 기준 : 도서 10권

그 외 무료배송 기준
바로드림, eBook 상품을 주문한 경우, 플래티넘/골드/실버회원 무료배송쿠폰 이용하여 주문한 경우, 무료배송 등록 상품을 주문한 경우
4/16(수) 출고예정
기본배송지 기준
배송일자 기준 안내
로그인 : 회원정보에 등록된 기본배송지
로그아웃 : '서울시 종로구 종로1' 주소 기준
로그인정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

키워드 Pick

키워드 Pick 안내

관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

책 소개

이 책이 속한 분야

초보자도 쉽게 접할 수 있는 데이터 사이언스
이 도서는 데이터 분석을 위한 프로그래밍 학습에 앞서 데이터와 빅데이터의 개념을 정리하고 그 활용과 필요성에 대해 설명하고 있습니다.
그리고 IT 비전공자들도 익숙한 MS 오피스 프로그램인 엑셀을 통해 데이터를 분석 가공해서 문제를 해결할 수 있도록 기본적인 내용으로 구성하였고 엑셀만으로 부족한 부분을 채울 수 있도록 프로그래밍 기반의 R을 중심으로 구성되어 있습니다.
R, RStudio를 중심으로 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요도구들의 사용법도 상세히 설명하고 있어 처음 R을 접하는 독자들도 데이터 과학을 빠르게 수행할 수 있도록 이끌어 주는 역할을 합니다.

작가정보

저자(글) 배정수

교수
동서대학교 소프트웨어융합대학 교수로 재직 중이며, 현재 컴퓨터공학 개론과 SW 기초와 관련한 강의를 진행하고 있다. 최근에는 SW중심대학사업단에서 비전공자들을 위한 AI·SW 교육 및 연구를 진행하고 있다.

저자(글) 황순욱

인하대학교 컴퓨터공학과에서 학사학위를, 고려대학교 전기전자컴퓨터공학과에서 석사학위를 받았으며, 일본 Aizu 대학 정보시스템 학과에서 박사학위 중퇴 후 부경대학교 과학기술정책 학과에서 박사학위를 취득하였다. 현재는 인공지능을 활용하는 데이터 분석 회사인 데이터클래식의 대표로 파이썬, R 등을 통해 데이터를 분석하는 프로젝트를 진행하고 있다. 또한, 동아대학교, 인제대학교 등에서 데이터 과학 프로그래밍, 웹 프로그래밍 등을 강의 중이다.

목차

  • CHAPTER 1 데이터 사이언스 001
    ■ 1.1 데이터란 무엇인가? 002
    1.1.1 데이터(Data)와 정보(Information) 002
    1.1.2 자료, 정보, 지식, 지혜의 사이클 004
    1.1.3 데이터 유형 005
    1.1.4 데이터 크기 007
    ■ 1.2 데이터 사이언스란? 008
    1.2.1 데이터 사이언스 정의 008
    1.2.2 데이터 사이언티스트(Data Scientist) 010
    1.2.3 데이터 분석 VS 데이터 사이언스 011
    ■ 1.3 데이터 사이언스 절차 012
    ■ 1.4 데이터 사이언스를 위한 소프트웨어 014

    CHAPTER 2 빅데이터 기술의 이해 017
    ■ 2.1 빅데이터란? 018
    2.1.1 빅데이터란 정확히 무엇일까요? 018
    2.1.2 빅데이터의 3V 021
    2.1.3 빅데이터의 부상 021
    ■ 2.2 빅데이터 분석 023
    ■ 2.3 빅데이터 활용 024
    ■ 2.4 빅데이터 시대의 빅브라더 등장 026

    CHAPTER 3 엑셀로 데이터 맛보기 029
    ■ 3.1 엑셀 몰아보기 030
    3.1.1 엑셀 화면 구성 030
    3.1.2 데이터 입력 033
    3.1.3 파일 저장 034
    3.1.4 파일 열기 035
    ■ 3.2 워크시트와 자동 서식 035
    3.2.1 삽입과 삭제 035
    3.2.2 이동과 복사 037
    3.2.3 미리 만들어진 서식으로 문서 만들기 040

    CHAPTER 4 엑셀로 데이터 정리하기 041
    ■ 4.1 데이터 채우기 042
    4.1.1 자동 채우기 042
    4.1.2 빠른 채우기 045
    ■ 4.2 데이터 유효성 검사하기 046
    4.2.1 데이터 유효성 검사 기능 046
    4.2.2 유효성 조건 설정 046
    ■ 4.3 중복데이터 정리하기 050
    ■ 4.4 셀 꾸미기 051
    4.4.1 셀 서식 051
    4.4.2 셀 스타일과 표 서식 056
    4.4.3 메모 058
    4.4.4 행과 열 크기 설정 060
    ■ 4.5 기본함수 익히기 061
    4.5.1 함수란? 061
    4.5.2 셀 참조 하기 062
    4.5.3 자동 합계 기능 064
    4.5.4 함수 라이브러리와 함수 마법사 068

    CHAPTER 5 엑셀로 데이터 고급지게 정리하기 071
    ■ 5.1 조건부 서식 072
    5.1.1 셀 강조 규칙과 상위/하위 규칙 072
    5.1.2 데이터 막대/색조/아이콘 집합 074
    5.1.3 수식을 사용한 조건부 서식 076
    5.1.4 규칙 관리 077
    ■ 5.2 차트 080
    5.2.1 차트의 구성 요소 080
    5.2.2 차트 만들기 081
    5.2.3 차트 편집 085
    5.2.4 스파크라인 차트 088

    CHAPTER 6 엑셀로 데이터 관리하기 091
    ■ 6.1 데이터 정렬하기 092
    6.1.1 정렬의 기본 092
    6.1.2 데이터 값으로 정렬 093
    6.1.3 서식으로 정렬 095
    ■ 6.2 데이터 추출하기 097
    6.2.1 자동 필터 097
    6.2.2 고급 필터 103
    ■ 6.3 피벗테이블 106
    6.3.1 피벗테이블 만들기 106
    6.3.2 피벗테이블 편집 108
    6.3.3 슬라이서 및 데이터 필터링 116

    CHAPTER 7 종합 예제 119
    ■ 7.1 시간대별 풍력 발전량 120
    ■ 7.2 졸업 과정과 급여의 관계 129

    CHAPTER 8 빅데이터 어떻게 다룰까? 135
    ■ 8.1 R이란? 136
    ■ 8.2 R과 RStudio 환경구축 136
    8.2.1 R 다운로드 및 설치 137
    8.2.2 R GUI 실행 140
    8.2.3 R Studio 다운로드 및 설치 141
    8.2.4 RStudio 실행 환경 143
    ■ 8.3 R과 RStudio 다루기 147
    8.3.1 RStudio에서 프로젝트 생성하기 147
    8.3.2 RStudio 스크립트 저장 150
    8.3.3 R Studio 스크립트 생성 152
    8.3.4 함수와 패키지 153

    CHAPTER 9 데이터 구조 157
    ■ 9.1 데이터 구조와 연산 158
    9.1.1 변수 158
    9.1.2 벡터 163
    9.1.3 팩터(factor) 174
    9.1.4 행렬 175
    9.1.5 리스트 183
    9.1.6 데이터 프레임 187
    ■ 9.2 데이터 읽고 쓰기 201
    9.2.1 파일 저장하기 201
    9.2.2 파일 불러오기 202
    9.2.3 R 내장 데이터 읽기 206
    ■ 9.3 데이터 정제하기 208
    9.3.1 데이터 추출 209
    9.3.2 일괄 처리하기 212
    9.3.3 NA 처리하기 218
    9.3.4 이상치 정제하기 220

    CHAPTER 10 데이터 시각화해 봤니? 223
    ■ 10.1 데이터 시각화란? 224
    ■ 10.2 ggplot2 사용하기 225
    ■ 10.3 히스토그램 227
    ■ 10.4 밀도 도표 228
    ■ 10.5 상자 도표 230
    ■ 10.6 산점도 233
    ■ 10.7 바 차트(Bar Chart) 235

    CHAPTER 11 누가 생존했을까? 239
    ■ 11.1 Kaggle? 240
    ■ 11.2 Titanic Dataset 240
    ■ 11.3 데이터 수집 240
    ■ 11.4 데이터 살펴보기 241
    11.4.1 새 프로젝트 생성 241
    11.4.2 새 스크립트 파일 생성 242
    11.4.3 파일 불러오기 242
    11.4.4 데이터 살펴보기 243
    11.4.5 데이터 요약 245
    ■ 11.5 데이터 정제하기 245
    ■ 11.6 데이터 시각화하기 248

    CHAPTER 12 사람들은 어디로 많이 갔을까? 257
    ■ 12.1 SK Data Hub 258
    ■ 12.2 데이터 수집 258
    ■ 12.3 데이터 살펴보기 259
    ■ 12.4 데이터 정제하기 262
    ■ 12.5 데이터 시각화하기 265
    CHAPTER 13

    CHAPTER 13 우리나라 인구는 어떻게 변했을까? 273
    ■ 13.1 공공데이터 274
    ■ 13.2 데이터 수집 274
    ■ 13.3 데이터 살펴보기 276
    ■ 13.4 데이터 정제하기 279
    ■ 13.5 데이터 시각화하기 284

    CHAPTER 14 어떤 단어들이 많이 등장했을까? 289
    ■ 14.1 비정형 데이터 290
    ■ 14.2 데이터 수집 290
    ■ 14.3 데이터 살펴보기 295
    ■ 14.4 데이터 정제하기 297
    ■ 14.5 텍스트 정형화하기 300
    ■ 14.6 데이터 시각화하기 304

    CHAPTER 15 웹데이터 가져오기? 307
    ■ 15.1 웹 스크래핑? 308
    ■ 15.2 데이터 수집 308
    ■ 15.3 데이터 살펴보기 310
    ■ 15.4 데이터 정제하기 314
    ■ 15.5 데이터 시각화하기 319

    INDEX 321

책 속으로

우리는 다양한 종류의 디지털 소스로부터 매일같이 수많은 데이터가 쏟아져나오는 빅데이터 시대를 살아가고 있습니다. 앞으로 우리가 직면하게 될 4차 산업혁명 시대는 초연결성, 초지능성 사회를 지향하고 있습니다. 4차 산업혁명의 핵심 기술 중의 하나로 지목되고 있는 사물인터넷 기술로 인해 우리가 접하게 될 데이터의 크기와 종류는 더 크고 광범위해질 것으로 여겨집니다. 이것은 우리가 앞으로 다루게 될 데이터가 점차 기존의 데이터 관리 소프트웨어의 한계를 넘어선다는 것을 의미합니다. 그렇다면 어떻게 빅데이터를 다룰 수 있을까요? 이 책에서는 프로그래밍 언어 R을 소개합니다.

8.1 R이란?
R은 통계 및 그래픽을 위한 프로그래밍 언어입니다. 소프트웨어 개발을 위한 언어라기보다는 데이터를 분석하고 시각화하는 데 최적화된 언어라고 할 수 있습니다. R은 1990년대 초 뉴질랜드 오클랜드 대학의 로버트 젠틀맨과 로스 이하카에 의해 통계처리를 목적으로 개발되었지만, 그 응용분야가 점차 데이터마이닝, 머신러닝 등으로 확장되었습니다. R의 큰 장점은 오픈소스 언어이기 때문에 누구나 무료로 이용할 수 있다는 점입니다. 또한 인터프리터 언어로 컴파일 과정을 거치지 않아 분석 과정이 비교적 간결하며, 비전공자도 쉽게 배울 수 있다는 장점이 있습니다. 이러한 이유로 R은 빅데이터 시대에 여러 다양한 분
야의 데이터 분석가들로부터 사랑을 받고 있습니다.
데이터 분석은 데이터를 수집하고, 데이터를 정제하고, 데이터를 시각화하고, 여러가지 분석 방법을 통해 분석하는 과정을 거쳐 데이터 안에 숨어있는 정보를 찾습니다. 우리는 R을 통해 데이터를 수집하는 방법과 데이터를 분석하기 전에 전처리하고 시각화 하는 방법에 대해 공부하려고 합니다.

8.2 R과 RStudio 환경구축
본격적으로 R을 다루기 위해서는 먼저 PC에 R과 RStudio를 설치해줘야 합니다. RStudio는 R을 사용하여 프로그램 작업을 편하게 할 수 있도록 도와주는 통합개발환경(Integrated Development Environments: IDE) 입니다. R과 RStudio는 인터넷상에서 무료로 다운받을 수 있습니다. 먼저 R을 다운로드하고 설치해봅시다.

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수을(를) 나타낸 표입니다.
ISBN 9791188831708
발행(출시)일자 2020년 12월 27일
쪽수 328쪽
크기
189 * 258 * 15 mm / 711 g
총권수 1권

Klover 리뷰 (0)

구매 후 리뷰 작성 시, e교환권 200원 적립

Klover리뷰를 작성해 보세요.

문장수집 (0)

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여주는 교보문고의 새로운 서비스입니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 "좋아요“ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보 없이 삭제될 수 있습니다.
리워드 안내
구매 후 90일 이내에 문장수집 작성 시 e교환권 100원을 적립해드립니다.
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)

구매 후 리뷰 작성 시, e교환권 100원 적립

이 책의 첫 기록을 남겨주세요.

교환/반품/품절 안내

  • 반품/교환방법

    마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환 신청, [1:1 상담 > 반품/교환/환불] 또는 고객센터 (1544-1900)
    * 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900)
  • 반품/교환가능 기간

    변심반품의 경우 수령 후 7일 이내,
    상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
  • 반품/교환비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 반품/교환 불가 사유

    1) 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
    2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
    3) 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
    4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
    5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
    6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
    7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
    8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
    9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등
  • 상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
  • 소비자 피해보상 환불 지연에 따른 배상

    1) 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
    2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

TOP