본문 바로가기

추천 검색어

실시간 인기 검색어

파이썬기반 SNS텍스트 데이터마이닝

서혜선 저자(글)
교우 · 2024년 02월 05일
2.5
10점 중 2.5점
(1개의 리뷰)
집중돼요 (100%의 구매자)
  • 파이썬기반 SNS텍스트 데이터마이닝 대표 이미지
    파이썬기반 SNS텍스트 데이터마이닝 대표 이미지
  • A4
    사이즈 비교
    210x297
    파이썬기반 SNS텍스트 데이터마이닝 사이즈 비교 188x257
    단위 : mm
01 / 02
무료배송 소득공제
18,000
적립/혜택
540P

기본적립

3% 적립 540P

추가적립

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 540P
  • 리뷰 작성 시, e교환권 추가 최대 300원
배송안내
무료배송
배송비 안내
국내도서/외국도서
도서 포함 15,000원 이상 구매 시 무료배송
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)

15,000원 미만 시 2,500원 배송비 부과

교보Only(교보배송)
각각 구매하거나 함께 20,000원 이상 구매 시 무료배송

20,000원 미만 시 2,500원 배송비 부과

해외주문 서양도서/해외주문 일본도서(교보배송)
각각 구매하거나 함께 15,000원 이상 구매 시 무료배송

15,000원 미만 시 2,500원 배송비 부과

업체배송 상품(전집, GIFT, 음반/DVD 등)
해당 상품 상세페이지 "배송비" 참고 (업체 별/판매자 별 무료배송 기준 다름)
바로드림 오늘배송
업체에서 별도 배송하여 1Box당 배송비 2,500원 부과

1Box 기준 : 도서 10권

그 외 무료배송 기준
바로드림, eBook 상품을 주문한 경우, 플래티넘/골드/실버회원 무료배송쿠폰 이용하여 주문한 경우, 무료배송 등록 상품을 주문한 경우
3/28(금) 출고예정
기본배송지 기준
배송일자 기준 안내
로그인 : 회원정보에 등록된 기본배송지
로그아웃 : '서울시 종로구 종로1' 주소 기준
로그인정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

키워드 Pick

키워드 Pick 안내

관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

파이썬을 이용한 비정형 데이터의 웹 크롤링을 통한 데이터 수집 과정과 수집된 데이터의 전처리, 그리고 문장을 주요 어휘 단위로 나누기 및 주요 어휘에 대한 워드클라우드 시각화 등을 다루는 책이다. 또한 어휘들의 거리 유사도 기반의 군집화, 군집분석에 의한 토픽별 세부 분석으로 TF-IDF, LDA 토픽 모델링, 감성분석 그리고 일반화선형모형을 다루고 있다.

작가정보

저자(글) 서혜선

출간작으로 『파이썬기반 SNS텍스트 데이터마이닝』 등이 있다.

작가의 말

빅데이터의 풍요 속에서, 특히 소셜 미디어상의 방대한 정보들은 각 산업분야(도메인)별로 매우 의미 있게 사용되고 있다. 온라인 블로그나 카페 및 각종 기사, 웹문서들의 활용뿐만 아니라, 영화 예매 사이트, 온라인 쇼핑몰, 맛집 리뷰 및 댓글 등의 정보 기반 마케팅 활동들(영화, 제품, 맛집 추천 등)이 매우 활발하다. 따라서 이러한 비정형 형태의 소셜 텍스트 데이터를 수집 및 정리하여 분석하고, 데이터에 함축되고 내재된 의미를 찾는 과정을 수행 할 수 있다면 비록 빅데이터 관련 전공자가 아니라 할지라도 상당히 경쟁력 있는 역량을 갖추게 될 것이다.
이렇게 온라인상의 다양한 정보를 크롤링하여 수집하고 분석하는 일련의 작업을 위해 필요한 소프트웨어 중에서 가장 대표적인 것이 파이썬이다. 이 책에서는 파이썬을 이용한 비정형 데이터의 웹 크롤링을 통한 데이터 수집 과정과 수집된 데이터의 전처리, 그리고 문장을 주요 어휘 단위로 나누기 및 주요 어휘에 대한 워드클라우드 시각화 등을 다룬다. 또한 어휘들의 거리 유사도 기반의 군집화, 군집분석에 의한 토픽별 세부 분석으로 TF-IDF, LDA 토픽 모델링, 감성분석 그리고 일반화선형모형을 다루게 된다.
이 책을 학습한 독자들은 본인들의 주된 관심 영역에 대해 텍스트 데이터 마이닝의 전 과정을 수행 할 수 있다. 특히 3장에서 7장까지 차근차근 학습하고 각 장별 연습문제를 크롤링 과정을 통해 정리해 간다면 이 책의 마무리가 될 즈음 여러분은 텍스트 데이터 분석에 대한 자신감으로 충만할 것이다.
본문에 사용된 크롤링 데이터와 프로그램은 ㈜교우(www.kyowoo.co.kr)나 https://github.com/Hyesun-SUH/Text-data-mining에서 다운 받을 수 있다.
마지막으로 방학동안 웹 크롤링 세미나에 함께 참여했던 빅데이터 랩 연구실의 학생들에게 감사의 마음을 전한다.

목차

  • 1장 웹 크롤링 준비
    1.1 SNS 텍스트 데이터의 이해
    1.2 웹 크롤링에 필요한 분석 도구 파이썬과 아나콘다 소개
    1.3 아나콘다 설치하기
    1.4 웹 크롤링시 주의점

    2장 웹 크롤링 경험하기
    2.1 쥬피터 노트북 소개
    2.2 웹 크롤링 시작하기
    2.3 BS4를 활용한 기사 제목 수집
    2.4 수집된 데이터의 전처리 및 워드클라우드 맛보기
    2.5 연습문제

    3장 Selenium을 이용한 동적 크롤링
    3.1 파이썬 라이브러리 Selenium 소개
    3.2 Selenium의 주요 메서드
    3.3 Selenium을 이용한 동적 크롤링 해보기
    3.4 네이버 카페와 다음 카페 크롤링
    3.5 연습문제

    4장 크롤링 데이터의 전처리
    4.1 크롤링 데이터 합치기
    4.2 데이터 전처리
    4.3 연습문제

    5장 텍스트 데이터 마이닝
    5.1 명사별 상위 빈도
    5.2 워드클라우드(Wordcloud)
    5.3 TF-IDF(Term Frequency-Inverse Document Frequency)
    5.4 K-평균 군집화
    5.5 토픽 모델링
    5.6 연습문제

    6장 감성 분석
    6.1 감성 분석 방법론
    6.2 감성 사전
    6.3 KNU 기반 감성 분석
    6.4 EmpLex 기반 감성 분석
    6.5 감성 상관분석
    6.6 연습 문제

    7장 텍스트 데이터의 모델링
    7.1 N-gram 언어 모형
    7.2 일반화선형모형(Generalized Linear Model, GLM)
    7.3 연습문제

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수을(를) 나타낸 표입니다.
ISBN 9791125103844
발행(출시)일자 2024년 02월 05일
쪽수 190쪽
크기
188 * 257 * 12 mm / 541 g
총권수 1권

Klover

구매 후 리뷰 작성 시, e교환권 200원 적립

10점 중 2.5점
/집중돼요
내용은 차치하고서라도 본문의 실습코드를 다운로드 받으려 했는데 안보인다. 서적 안내에서 두 가지 방법이 쓰여있다. (1)출판사(교우)에 들어가 보라고 해서 갔더니 코드없다. 해서 담당자 홈피 Q&A에 연락 남겼는데 함흥차사다. (2)저자 Github를 알려줘 들어갔더니 여기도 아무것도 없다. 실망이다! 독자는 20년 이상 이전부터 텍스트마이닝 등을 코딩하고 연구해 온 독자인데 너무 어이없다. 참고로 하려는 것이고, 대단한 실습코드도 아닌데 어떻게 이런식으로 영업하나?!

문장수집 (0)

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여주는 교보문고의 새로운 서비스입니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 "좋아요“ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보 없이 삭제될 수 있습니다.
리워드 안내
구매 후 90일 이내에 문장수집 작성 시 e교환권 100원을 적립해드립니다.
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)

구매 후 리뷰 작성 시, e교환권 100원 적립

이 책의 첫 기록을 남겨주세요.

교환/반품/품절 안내

  • 반품/교환방법

    마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환 신청, [1:1 상담 > 반품/교환/환불] 또는 고객센터 (1544-1900)
    * 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900)
  • 반품/교환가능 기간

    변심반품의 경우 수령 후 7일 이내,
    상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
  • 반품/교환비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 반품/교환 불가 사유

    1) 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
    2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
    3) 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
    4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
    5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
    6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
    7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
    8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
    9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등
  • 상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
  • 소비자 피해보상 환불 지연에 따른 배상

    1) 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
    2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

TOP