실시간 분석의 모든 것
해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.
패키지
북카드
키워드 Pick
키워드 Pick 안내
관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

작가정보
저자(글) 바이런 엘리스
저자 바이런 엘리스 Byron Ellis는 광고 기술 기업인 스펀지셀(Spongecell)의 CTO. 연구와 개발뿐만 아니라 스펀지셀의 컴퓨팅 인프라의 유지 관리를 담당하고 있다. 스펀지셀에 입사하기 전에는 온라인 연결 기술의 선두 업체인 라이브퍼슨(Liveperson)의 최고 데이터 과학자(Chief Data Scientist)였다. 세계 최대의 광고 거래 플랫폼 중 하나인 애드브라이트(adBrite)에서 다양한 직급을 역임하기도 했다. 하버드 대학교에서 통계학 박사학위를 취득했다.
번역 이상훈
역자 이상훈은 빅데이터 및 실시간 분석 전문가. 연세대학교에서 패턴인식으로 석사학위를 받았고, 수년간 KIST (한국과학기술연구원)에서 데이터 분석과 기계학습 관련 업무를 담당했다. 현재는 SK주식회사에서 빅데이터 처리 및 분석을 하고 있다. 스파크와 R을 이용한 실시간 처리와 분석을 주제로 정부 기관 및 기업에서 강의를 하고 있으며, 한국 스파크 사용자 모임(facebook.com/groups/SparkKoreaUser) 운영진으로 활동 중이다.
목차
- 1. 스트리밍 데이터 소개
__1.1 스트리밍 데이터의 원천
__1.2 스트리밍 데이터만의 특징
__1.3 인프라 및 알고리즘
__1.4 마치며
1부. 스트리밍 분석 아키텍처
2. 실시간 스트리밍 아키텍처 설계
__2.1 실시간 아키텍처의 구성요소
__2.2 실시간 아키텍처의 특징
__2.3 실시간 프로그래밍을 위한 언어
__2.4 실시간 아키텍처 체크리스트
__2.5 마치며
3. 서비스 구성 및 조정
__3.1 구성 및 조정 시스템의 출현 배경
__3.2 분산 상태 유지
__3.3 아파치 주키퍼
__3.4 마치며
4. 스트리밍 분석에서의 데이터 흐름 관리
__4.1 분산 데이터 흐름
__4.2 아파치 카프카: 높은 처리량을 가지는 분산 메시징
__4.3 아파치 플룸: 분산 로그 수집
__4.4 마치며
5. 스트리밍 데이터 처리
__5.1 분산 스트리밍 데이터 처리
__5.2 스톰을 이용한 데이터 처리
__5.3 삼자를 이용한 데이터 처리
__5.4 마치며
6. 스트리밍 데이터 저장
__6.1 일관된 해싱
__6.2 NoSQL 저장 시스템
__6.3 기타 저장 기술
__6.4 기술 선택하기
__6.5 웨어하우징
__6.6 마치며
2부. 분석 및 시각화
7. 스트리밍 메트릭 전달
__7.1 스트리밍 웹 애플리케이션
__7.2 데이터 시각화하기
__7.3 모바일 스트리밍 애플리케이션
__7.4 마치며
8. 정확한 집계와 전달
__8.1 특정 시점 카운팅과 합계
__8.2 다중 해상도 시계열 집계
__8.3 확률적 최적화
__8.4 시계열 데이터 전송
__8.5 마치며
9. 스트리밍 데이터의 통계적 근사
__9.1 수치 라이브러리
__9.2 확률과 분포
__9.3 분포 살펴보기
__9.4 난수 생성
__9.5 표집 절차
__9.6 마치며
10. 스케치를 이용한 스트리밍 데이터 근사
__10.1 레지스터와 해시 함수
__10.2 집합
__10.3 블룸 필터
__10.4 고유 값 스케치
__10.5 카운트-최소 스케치
__10.6 다른 애플리케이션
__10.7 마치며
11. 단순 집계를 넘어서는 고급 기법
__11.1 실시간 데이터를 위한 모형
__11.2 모형 예측
__11.3 모니터링
__11.4 실시간 최적화
__11.5 마치며
추천사
-
“이 책은 데이터 시스템을 수집, 전달, 처리, 저장, 시각화 단계로 나누고 각 단계에서 사용할 수 있는 대표적인 오픈소스 기술들을 일목요연하게 정리해주기 때문에, 시스템을 처음 설계하는 입장에서 무슨 선택이 있는지를 한눈에 배울 수 있다. 이 책만큼 실시간 데이터 분석 분야를 처음부터 끝까지 두루두루 균형 잡힌 시선으로 정리해준 책은 본 적이 없다.”
출판사 서평
빅데이터 분석의 새로운 패러다임 실시간 분석 솔루션 구축 가이드
많은 기업이 실시간으로 발생하는 데이터로부터 빠른 비즈니스 인사이트를 얻기 위해 부단히 노력하고 있다. 데이터를 저장한 후 분석하는 기존 배치 방식은 인사이트 확보 타이밍을 제대로 맞추기 어려웠다. 이에 적시에 신속히 중대 의사결정을 내릴 수 있도록 프로세스 시간을 획기적으로 단축해주는 실시간 분석 솔루션에 대한 관심이 고조되고 있다.
이 책은 이러한 트렌드에 맞춰, 스트리밍 데이터의 수집, 전달, 처리, 저장, 시각화까지 실시간 분석의 전 단계를 망라하는 가성비 높은 솔루션을 구축하는 지침을 제공한다. 스트리밍 데이터의 특성을 살펴본 다음(1장), 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 설계 및 구성하고(2~3장) 데이터를 처리 및 저장(4~6장)하는 방법을 알아본다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고(7~8장), 데이터를 표집하고 추정값을 얻어내는 데 사용하는 통계 기법과 알고리즘을 살펴본다(9~10장). 끝으로 실시간 데이터를 모니터링하고 실시간에 맞게 최적화하는 고급 기법을 살펴본다(11장).
관련 기술이 워낙 많고 빨리 변하다 보니 개별 기술은 알아도 그것을 실무에서 어떻게 사용할지 곤혹스러워하는 경우가 많다. 이에 실시간 처리에 꼭 필요한 기술이 어떤 흐름에 따라 유기적으로 활용되는지 길을 제시해주는 이 책의 가치가 더 크다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.
주요 내용
- 스트리밍 데이터 시스템의 구성요소를 이해하고 최대한 활용하는 방법
- 스트리밍 데이터의 분석 및 저장과 관련된 아키텍처와 모범 사례
- 오픈소스 및 상업 툴을 이용하여 데이터 집계, 전달, 웨어하우징 시스템 구축
- 스트리밍 애플리케이션에 필요한 고급 알고리즘 및 자료구조의 구현 및 응용
예제 소스
http://www.hanbit.co.kr/exam/2229
기본정보
ISBN | 9788968482298 | ||
---|---|---|---|
발행(출시)일자 | 2015년 12월 15일 | ||
쪽수 | 480쪽 | ||
크기 |
183 * 235
mm
/ 852 g
|
||
총권수 | 1권 | ||
원서명/저자명 | Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data/Byron Ellis |
Klover
e교환권은 적립 일로부터 180일 동안 사용 가능합니다.
리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 리뷰 종류별로 구매한 아이디당 한 상품에 최초 1회 작성 건들에 대해서만 제공됩니다.
판매가 1,000원 미만 도서의 경우 리워드 지급 대상에서 제외됩니다.
일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
리뷰는 1인이 중복으로 작성하실 수는 있지만, 평점계산은 가장 최근에 남긴 1건의 리뷰만 반영됩니다.
구매 후 리뷰 작성 시, e교환권 200원 적립
문장수집
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
구매 후 리뷰 작성 시, e교환권 100원 적립