파이썬기반 SNS텍스트 데이터마이닝
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)
15,000원 미만 시 2,500원 배송비 부과
20,000원 미만 시 2,500원 배송비 부과
15,000원 미만 시 2,500원 배송비 부과
1Box 기준 : 도서 10권
로그아웃 : '서울시 종로구 종로1' 주소 기준
이달의 꽃과 함께 책을 받아보세요!
1권 구매 시 결제 단계에서 적용 가능합니다.
알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.
작가의 말
빅데이터의 풍요 속에서, 특히 소셜 미디어상의 방대한 정보들은 각 산업분야(도메인)별로 매우 의미 있게 사용되고 있다. 온라인 블로그나 카페 및 각종 기사, 웹문서들의 활용뿐만 아니라, 영화 예매 사이트, 온라인 쇼핑몰, 맛집 리뷰 및 댓글 등의 정보 기반 마케팅 활동들(영화, 제품, 맛집 추천 등)이 매우 활발하다. 따라서 이러한 비정형 형태의 소셜 텍스트 데이터를 수집 및 정리하여 분석하고, 데이터에 함축되고 내재된 의미를 찾는 과정을 수행 할 수 있다면 비록 빅데이터 관련 전공자가 아니라 할지라도 상당히 경쟁력 있는 역량을 갖추게 될 것이다.
이렇게 온라인상의 다양한 정보를 크롤링하여 수집하고 분석하는 일련의 작업을 위해 필요한 소프트웨어 중에서 가장 대표적인 것이 파이썬이다. 이 책에서는 파이썬을 이용한 비정형 데이터의 웹 크롤링을 통한 데이터 수집 과정과 수집된 데이터의 전처리, 그리고 문장을 주요 어휘 단위로 나누기 및 주요 어휘에 대한 워드클라우드 시각화 등을 다룬다. 또한 어휘들의 거리 유사도 기반의 군집화, 군집분석에 의한 토픽별 세부 분석으로 TF-IDF, LDA 토픽 모델링, 감성분석 그리고 일반화선형모형을 다루게 된다.
이 책을 학습한 독자들은 본인들의 주된 관심 영역에 대해 텍스트 데이터 마이닝의 전 과정을 수행 할 수 있다. 특히 3장에서 7장까지 차근차근 학습하고 각 장별 연습문제를 크롤링 과정을 통해 정리해 간다면 이 책의 마무리가 될 즈음 여러분은 텍스트 데이터 분석에 대한 자신감으로 충만할 것이다.
본문에 사용된 크롤링 데이터와 프로그램은 ㈜교우(www.kyowoo.co.kr)나 https://github.com/Hyesun-SUH/Text-data-mining에서 다운 받을 수 있다.
마지막으로 방학동안 웹 크롤링 세미나에 함께 참여했던 빅데이터 랩 연구실의 학생들에게 감사의 마음을 전한다.
목차
- 1장 웹 크롤링 준비
1.1 SNS 텍스트 데이터의 이해
1.2 웹 크롤링에 필요한 분석 도구 파이썬과 아나콘다 소개
1.3 아나콘다 설치하기
1.4 웹 크롤링시 주의점
2장 웹 크롤링 경험하기
2.1 쥬피터 노트북 소개
2.2 웹 크롤링 시작하기
2.3 BS4를 활용한 기사 제목 수집
2.4 수집된 데이터의 전처리 및 워드클라우드 맛보기
2.5 연습문제
3장 Selenium을 이용한 동적 크롤링
3.1 파이썬 라이브러리 Selenium 소개
3.2 Selenium의 주요 메서드
3.3 Selenium을 이용한 동적 크롤링 해보기
3.4 네이버 카페와 다음 카페 크롤링
3.5 연습문제
4장 크롤링 데이터의 전처리
4.1 크롤링 데이터 합치기
4.2 데이터 전처리
4.3 연습문제
5장 텍스트 데이터 마이닝
5.1 명사별 상위 빈도
5.2 워드클라우드(Wordcloud)
5.3 TF-IDF(Term Frequency-Inverse Document Frequency)
5.4 K-평균 군집화
5.5 토픽 모델링
5.6 연습문제
6장 감성 분석
6.1 감성 분석 방법론
6.2 감성 사전
6.3 KNU 기반 감성 분석
6.4 EmpLex 기반 감성 분석
6.5 감성 상관분석
6.6 연습 문제
7장 텍스트 데이터의 모델링
7.1 N-gram 언어 모형
7.2 일반화선형모형(Generalized Linear Model, GLM)
7.3 연습문제
기본정보
ISBN | 9791125103844 |
---|---|
발행(출시)일자 | 2024년 02월 05일 |
쪽수 | 190쪽 |
크기 |
188 * 257
* 12
mm
/ 541 g
|
총권수 | 1권 |
Klover
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집 (0)
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)
구매 후 리뷰 작성 시, e교환권 100원 적립
-
반품/교환방법
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900) -
반품/교환가능 기간
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내 -
반품/교환비용
-
반품/교환 불가 사유
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등 -
상품 품절
-
소비자 피해보상 환불 지연에 따른 배상
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함
상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)
기분 좋은 발견
이 분야의 베스트
이 분야의 신간
-
50개의 프로젝트로 완성하는 파이썬 업무 자동화10% 19,800 원
-
우아한 C 언어 코딩 패턴10% 28,800 원
-
닥터, 코드를 만나다30,000 원
-
리액트의 정석 with 타입스크립트34,000 원
-
코딩 자율학습 잔재미코딩의 파이썬 데이터 분석 입문10% 23,400 원