본문 바로가기

추천 검색어

실시간 인기 검색어

머신러닝을 위한 실전 데이터셋

개인 정보를 보호하고 머신러닝 학습에 사용할 합성 데이터 만들기
한빛미디어 · 2021년 01월 04일
9.6
10점 중 9.6점
(7개의 리뷰)
도움돼요 (33%의 구매자)
  • 머신러닝을 위한 실전 데이터셋 대표 이미지
    머신러닝을 위한 실전 데이터셋 대표 이미지
  • A4
    사이즈 비교
    210x297
    머신러닝을 위한 실전 데이터셋 사이즈 비교 184x236
    단위 : mm
01 / 02
MD의 선택 무료배송 이벤트 소득공제
10% 16,200 18,000
적립/혜택
900P

기본적립

5% 적립 900P

추가적립

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 900P
  • 리뷰 작성 시, e교환권 추가 최대 300원
배송안내
무료배송
배송비 안내
국내도서/외국도서
도서 포함 15,000원 이상 구매 시 무료배송
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)

15,000원 미만 시 2,500원 배송비 부과

교보Only(교보배송)
각각 구매하거나 함께 20,000원 이상 구매 시 무료배송

20,000원 미만 시 2,500원 배송비 부과

해외주문 서양도서/해외주문 일본도서(교보배송)
각각 구매하거나 함께 15,000원 이상 구매 시 무료배송

15,000원 미만 시 2,500원 배송비 부과

업체배송 상품(전집, GIFT, 음반/DVD 등)
해당 상품 상세페이지 "배송비" 참고 (업체 별/판매자 별 무료배송 기준 다름)
바로드림 오늘배송
업체에서 별도 배송하여 1Box당 배송비 2,500원 부과

1Box 기준 : 도서 10권

그 외 무료배송 기준
바로드림, eBook 상품을 주문한 경우, 플래티넘/골드/실버회원 무료배송쿠폰 이용하여 주문한 경우, 무료배송 등록 상품을 주문한 경우
주문정보를 불러오는 중입니다.
기본배송지 기준
배송일자 기준 안내
로그인 : 회원정보에 등록된 기본배송지
로그아웃 : '서울시 종로구 종로1' 주소 기준
로그인정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

북카드

키워드 Pick

키워드 Pick 안내

관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

개인 정보 보호와 광범위한 데이터 사용의 균형을 이루다.
머신러닝 모델을 구축하고, 테스트를 진행하려면 크고 다양한 종류의 데이터가 필요하다. 그러나 대부분의 데이터셋은 개인 정보 문제로 사용이 제한적이라 광범위하게 사용할 수 없다. 이 책에서는 실제 데이터로 새로운 데이터를 만드는 실용적인 합성 데이터 기술을 소개한다. 합성 데이터는 이차 분석에 용이하여 데이터 연구, 고객 행동의 이해, 신제품 개발 등 다양한 목적으로 활용될 수 있다.

이 책은 실제 데이터를 합성해 다양한 산업에서 사용할 수 있는 방법을 제공하며, 개인 정보 문제를 해결하는 방법을 다룬다. 또한 실제 데이터셋에서 합성 데이터를 생성하기 위한 원칙과 단계를 배운다. 더 나아가 합성 데이터가 제품이나 솔루션 개발에 드는 시간을 어떻게 단축할 수 있는지를 학습한다.

● 다변량 정규 분포를 사용해 합성 데이터 생성하기
● 다양한 적합도 메트릭을 분포 적합하기
● 원본 데이터의 구조를 복제하기
● 관계가 복잡한 데이터를 모델링하기
● 데이터 효용성을 평가하는 방식과 측정 기준 정하기
● 실제 데이터를 분석해 합성 데이터를 복제하기
● 합성 데이터의 개인 정보와 신원 노출을 평가하기

작가정보

저자(글) 칼리드 엘 에맘

Khaled El Emam
Eastern Ontario Research Institute의 아동병원 선임 과학자이자 종합적인 전자 건강 정보연구소 소장으로 합성 데이터 생성 방법과 도구에 대한 응용 학술 연구를 수행하고 재식별 위험성을 측정한다. 또 오타와 대학교 의과대학 교수로 재직 중이다.
칼리드는 의료산업에서 인공지능과 머신러닝(Artificial Intelligence and Machine Learning, AIML)의 응용을 추진하기 위해 합성 데이터 개발에 주력하는 Replica Analytics의 공동 설립자다. 동시에 데이터 보호 기술을 개발하고 의료 서비스를 제공하며 신약 발명을 지원하는 분석 도구를 구축하는 기술 회사의 이사회에서 투자, 자문, 이사를 겸임하고 있다.

목차

  • CHAPTER 1 합성 데이터 생성 소개
    1.1 합성 데이터 정의
    1.2 합성 데이터의 이점
    1.3 합성 데이터의 활용 사례
    1.4 요약

    CHAPTER 2 데이터 합성
    2.1 합성 시기
    2.2 식별화 가능성 스펙트럼
    2.3 데이터 접근 활성화를 위한 PET 선택의 절충
    2.4 데이터 합성 프로젝트
    2.5 데이터 합성 파이프라인
    2.6 합성 프로그램 관리
    2.7 요약

    CHAPTER 3 시작: 분포 적합
    3.1 데이터 프레임
    3.2 데이터 분포 유형
    3.3 실제 데이터에 분포 적합시키기
    3.4 분포로부터 합성 데이터 생성
    3.5 요약

    CHAPTER 4 합성 데이터의 효용성 평가
    4.1 합성 데이터 효용성 프레임워크: 분석 복제
    4.2 합성 데이터의 효용성 프레임워크: 효용성 메트릭
    4.3 요약

    CHAPTER 5 데이터 합성 방법
    5.1 합성 데이터 생성 이론
    5.2 실제 합성 데이터 생성
    5.3 하이브리드 합성 데이터
    5.4 머신러닝 방법
    5.5 딥러닝 방법
    5.6 시퀀스 합성
    5.7 요약

    CHAPTER 6 합성 데이터의 신원 식별
    6.1 노출 유형
    6.2 개인 정보 보호법이 합성 데이터의 생성과 사용에 미치는 영향
    6.3 요약

    CHAPTER 7 실제 데이터 합성
    7.1 데이터 복잡성 관리
    7.2 데이터 합성 구성
    7.3 결론

출판사 서평

합성 데이터는 지난 몇 년간 주목을 받으며 사회적 관심이 급속도로 증가했는데, 이러한 현상은 다음과 같은 두 가지에 관심이 쏠리면서 촉발됐다. 첫째는 인공지능과 머신러닝(AIML) 모델을 양성하고 구축하는 데 따른 대량의 데이터 수요다. 둘째는 고품질의 합성 데이터를 생성하는 효과적인 방법을 입증한 최근의 작업이다. 이로 인해 합성 데이터가 특히 AIML 커뮤니티 내에서 어려운 문제를 일부 상당히 효과적으로 해결할 수 있음을 인식하게 됐다. 따라서 NVIDIA, IBM, 알파벳과 같은 회사들만이 아니라 미국 인구조사국 같은 정부 기관도 모델 구축, 애플리케이션 개발, 데이터 배포를 지원하기 위해 다양한 유형의 데이터 합성 방법론을 채택하기에 이르렀다.

1장: 합성 데이터와 그 이점이 무엇인지 설명한다. 인공지능과 머신러닝(AIML) 프로젝트는 다양한 산업에서 사용되고 있으며, 광범위한 활용 사례 중 맛보기로 몇 가지를 발췌해 수록했다.

2장: 데이터 합성의 목표를 설정하고 다른 방법들에 비해 비즈니스 우선순위에 적합한 시기를 결정하는 데 도움되는 의사결정 프레임워크를 제시한다.

3장: 데이터 합성 프로세스의 첫 번째 단계인 분포 모델링을 다룬다. 비정형 데이터 분포를 머신러닝 모델에 적합하는 방법을 개략적으로 설명한다.

4장: 합성 데이터에 사용할 수 있는 데이터 효용성 프레임워크를 설명한다. 데이터 합성기 최적화, 데이터 합성 접근법, 합성 데이터의 결과 파악 등을 살펴본다.

5장: 기본 개념을 이용해 합성 데이터를 생성해본다. 몇 가지 기본적인 접근법으로 시작해서 뒤로 갈수록 복잡한 접근법으로 발전하며 입문자용 기술부터 고급 기술까지 다룬다.

6장: 먼저 데이터 합성이 보호하려는 노출 유형을 정의한다. 미국과 유럽연합의 주요 프라이버시 규정이 합성 데이터를 어떻게 다루는지 검토하고, 프라이버시 보장 분석을 시작할 방법을 제시한다.

7장: 합성 데이터셋과 합성 데이터 생성 기술을 전수해온 경험을 바탕으로 실제 데이터를 처리할 때 도움될 실용적인 고려사항을 제시한다. 도전적인 과업을 강조할 뿐만 아니라 과업을 해결할 방안도 제시한다.

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수, 원서(번역서)명/저자명을(를) 나타낸 표입니다.
ISBN 9791162243749
발행(출시)일자 2021년 01월 04일
쪽수 172쪽
크기
184 * 236 * 10 mm / 392 g
총권수 1권
원서(번역서)명/저자명 Practical Synthetic Data Generation/Khaled El Emam

Klover

구매 후 리뷰 작성 시, e교환권 200원 적립

10점 중 10점
/도움돼요
열심히 보겠습니다.
10점 중 10점
/쉬웠어요
책 내용 구성이 좋습니다.
10점 중 10점
/집중돼요
연구에 도움이 많이 됩니다
10점 중 10점
/쉬웠어요
실전 적용 위주의 다양한 예제를 다루고 있어서 응용력 기르기에 좋은 교재인거 같아요!

문장수집 (2)

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여주는 교보문고의 새로운 서비스입니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 "좋아요“ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보 없이 삭제될 수 있습니다.
리워드 안내
구매 후 90일 이내에 문장수집 작성 시 e교환권 100원을 적립해드립니다.
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)

구매 후 리뷰 작성 시, e교환권 100원 적립

우리에게 도전적인 문제를 안겨주는 고객과 협력자들은 데이터 합성 방법과 실제 기술 구현하는 과정에서 혁신을 주도하는 열쇠가 되었다.
머신러닝을 위한 실전 데이터셋
자사의 도구를 이용해 소비자의 데이터상에서 우아한 방식으로 문제를 해결하는 것을 보는 것보다 더 좋은 일은 없다
머신러닝을 위한 실전 데이터셋

교환/반품/품절 안내

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

TOP