R을 이용한 웹 크롤링과 텍스트 분석
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
로그아웃 : '서울시 종로구 종로1' 주소 기준
이달의 꽃과 함께 책을 받아보세요!
1권 구매 시 결제 단계에서 적용 가능합니다.
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
R을 이용한 텍스트마이닝은 대용량 텍스트를 분석하는 도구로, 대용량 텍스트로부터 유용한 정보를 추출한다. 텍스트마이닝은 뉴스, 소셜미디어, 논문 등을 분석해 현상을 이해하고, 이론을 검증하는데 목적이 있다. 〈R을 이용한 웹 크롤링과 텍스트 분석〉은 실행과정에서의 오류를 최소화하기 위해 웹 크롤링과 텍스트 분석 처리기법들을 최신 버전으로 실행한 결과를 제시하고 있다.
1장, 2장은 R 프로그램의 기본 원리를 이해할 수 있도록 구성되어 있다. 3장은 R 프로그램의 기초 사용법을 익힐 수 있게 하고, 4장으로 기본적인 객체지향형 데이터 구조를 이해할 수 있다. 5장의 R기초통계는 통계의 이론적인 접근과 더불어 데이터에 대한 기술통계량과 중급통계를 실행할 수 있는 능력을 끌어올릴 수 있게 하고, 6장에서는 다양한 데이터를 그래프로 표현하여 시각화 하고, 데이터에 나타난 현상과 이론적 패턴을 찾아내는 방법을 학습한다. 이 책의 핵심은 7장의 R을 이용한 웹 크롤링과 8장의 텍스트 분석이다. 그렇기 때문에 이 책은 다양한 문서를 스크렙핑 또는 크롤링하는 역량을 익힐 수 있도록 많은 사례를 포함하고 있다.
저자는 R의 동향을 파악하고 상용 프로그램과 연결하는 연구를 통해 연구결과를 저널에 발표해왔다. 저자는 초기 R수용과정 경험을 이 책에 반영하고자 노력해왔다. 인공지능 시대, 머신러닝이 중요해진 이 시기에 〈R을 이용한 웹 크롤링과 텍스트 분석〉이 머신러닝 알고리즘 구현과 텍스트분석을 해내는 학생들을 양성하고 더 나아가 인공지능 연구에 기여가 되기를 기대한다.
작가정보
성균관대 미디어커뮤니케이션 학과 교수
텍스트 분석, AI 미디어와 이론, 사이버커뮤니케이션, 텔레커뮤니케이션, 커뮤니케이션이론을 주로 연구하고 있다. 서울대학교 언론정보학과에서 학사, 캘리포니아주립대 Radio-Television-Film학과에서 석사, 남 일리노이대에서 Mass Communication & Media Arts로 박사를 마쳤다. (주)삼성전자 홍보실과 아칸사스 주립대 신문방송학과에 조교수로 재직했으며, 캠브리지대에서 연구년을 보냈다. 역서로 〈노드엑셀을 이용한 소셜네트워크분석〉〈사이버커뮤니케이션이론〉, 〈아나운싱: 디지털시대방송커뮤니케이션〉와 저서로 〈커뮤니케이션 통계분석론〉 〈컨버전스와 미디어의 세계〉, 〈디지털미디어와 사회〉주요 연구로 AI 발달 연구, 빅(big)데이터 프레임, 창조경제 보도의제 설정, 소셜뷰잉, 상호작용차원연구, 미디어적소연구, 인터넷 미디어 뉴스형식 연구, 인터넷 발달 보도 프레임 연구, 뉴 할리우드 영화의 포스트모더니즘 연구, 인터넷 광고 효과 모형, 온라인 저널리즘 기사구성방식 비교, 생명공학 보도경향 연구등이 있다. 소통학회 회장역임, 현 인터넷융합학회 회장과AI와 미디어 포럼 운영을 하고 있다.
목차
- 머리말
Chapter 1 R 프로그램 설치 및 환경설정
1.1 R 소개
1.2 R 프로그램 설치하기
1.3 R 프로그램의 구성
참고문헌
Chapter 2 R-Studio 프로그램 설치 및 환경설정
2.1 R-Studio 소개
2.2 R-Studio 설치하기
2.3 RStudio 프로그램 실행하기
2.4 R-Studio 프로그램의 환경 설정하기
2.5 R-Studio 프로그램의 기초 활용
참고문헌
Chapter 3 R 기초 사용법
3.1 기초 사용법
3.2 연산자 소개
3.3 데이터 유형
참고문헌
Chapter 4 데이터 종류 및 활용
4.1 데이터 형태
4.2 외부 데이터 읽어오기
4.3 데이터 추출하기
4.4 데이터 합치기
참고문헌
Chapter 5 기초통계
5.1 기초통계 및 T-test
5.2 분산분석
5.3 회귀분석
참고문헌
Chapter 6 그래프 사용 및 데이터 시각화
6.1 일변량 범주형 자료 시각화
6.2 일변량 연속형 자료 시각화
6.3 이변량 범주형 자료 시각화
6.4 이변량 연속형 자료 시각화
6.5 기타 그래프
참고문헌
Chapter 7 웹(web) 크롤링 이론과 실습
7.0 웹(web) 스크래핑 이해하기
7.1 커뮤니티 게시판 본문 수집 예제
7.2 커뮤니티 댓글 수집 예제
7.3 대형 포털 쇼핑 상품 정보, 평점, 리뷰 수집 예제
7.4 모바일 네이버 카페 본문 수집 예제
7.5 PC 네이버 블로그 본문 수집 예제
7.6 PC 네이버 뉴스 본문, 반응수, 댓글 수집 예제
참고문헌 240
Chapter 8 텍스트 분석
8.1 텍스트 분석의 정의와 데이터 처리
8.2 텍스트 분석을 위한 전처리 학습
8.3 뉴스 데이터수집과 분석
8.4 텍스트 분석 및 결과 제시
8.5 기계학습을 통한 텍스트 분석
참고문헌
참고문헌 및 추천 자료
색인
기본정보
ISBN | 9791190444316 |
---|---|
발행(출시)일자 | 2020년 08월 30일 |
쪽수 | 388쪽 |
크기 |
190 * 257
* 22
mm
/ 813 g
|
총권수 | 1권 |
Klover 리뷰 (2)
구매 후 리뷰 작성 시, e교환권 200원 적립
사용자 총점
100%의 구매자가
추천해요 라고 응답했어요
집중돼요
도움돼요
쉬웠어요
최고예요
추천해요
문장수집 (2)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)
기분 좋은 발견
이 분야의 베스트
이 분야의 신간
-
처음이지만 프로처럼 쓰는 Notion10% 19,800 원
-
2025 단·축·키 빅데이터 분석기사 실기(파이썬 작업형)10% 27,000 원
-
ChatGPT와 함께 하는 데이터 분석 기행33,000 원
-
첫 번째 논문 통계21,000 원
-
R을 이용한 통계 프로그래밍 기초25,000 원