본문 바로가기

추천 검색어

실시간 인기 검색어

자연어 처리의 정석

자연어 처리의 A-Z 과거부터 최근 연구까지
데이터 과학
에이콘출판 · 2022년 05월 30일
10.0
10점 중 10점
(1개의 리뷰)
추천해요 (100%의 구매자)
  • 자연어 처리의 정석 대표 이미지
    자연어 처리의 정석 대표 이미지
  • A4
    사이즈 비교
    210x297
    자연어 처리의 정석 사이즈 비교 188x235
    단위 : mm
01 / 02
MD의 선택 무료배송 이벤트 소득공제
10% 45,000 50,000
적립/혜택
2,500P

기본적립

5% 적립 2,500P

추가적립

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 2,500P
  • 리뷰 작성 시, e교환권 추가 최대 300원
배송안내
무료배송
배송비 안내
국내도서/외국도서
도서 포함 15,000원 이상 구매 시 무료배송
도서+사은품 또는 도서+사은품+교보Only(교보굿즈)

15,000원 미만 시 2,500원 배송비 부과

교보Only(교보배송)
각각 구매하거나 함께 20,000원 이상 구매 시 무료배송

20,000원 미만 시 2,500원 배송비 부과

해외주문 서양도서/해외주문 일본도서(교보배송)
각각 구매하거나 함께 15,000원 이상 구매 시 무료배송

15,000원 미만 시 2,500원 배송비 부과

업체배송 상품(전집, GIFT, 음반/DVD 등)
해당 상품 상세페이지 "배송비" 참고 (업체 별/판매자 별 무료배송 기준 다름)
바로드림 오늘배송
업체에서 별도 배송하여 1Box당 배송비 2,500원 부과

1Box 기준 : 도서 10권

그 외 무료배송 기준
바로드림, eBook 상품을 주문한 경우, 플래티넘/골드/실버회원 무료배송쿠폰 이용하여 주문한 경우, 무료배송 등록 상품을 주문한 경우
당일배송 오늘(3/27,목) 도착
기본배송지 기준
배송일자 기준 안내
로그인 : 회원정보에 등록된 기본배송지
로그아웃 : '서울시 종로구 종로1' 주소 기준
로그인정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

알림 신청하시면 원하시는 정보를
받아 보실 수 있습니다.

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

키워드 Pick

키워드 Pick 안내

관심 키워드를 주제로 다른 연관 도서를 다양하게 찾아 볼 수 있는 서비스로, 클릭 시 관심 키워드를 주제로 한 다양한 책으로 이동할 수 있습니다.
키워드는 최근 많이 찾는 순으로 정렬됩니다.

자연어 처리와 머신러닝/딥러닝을 통합하고 해당 과정들을 자세하게 설명하는 책이다. 전통적인 통계 기반의 자연어 처리 방법에서 시작해 최근의 딥러닝/머신러닝 방법을 사용한 자연어 처리 방법까지 다룬다. 먼저, 지도/비지도학습과 관련한 머신러닝 방법론에 대해 설명한 후, 자연어 처리를 다루는 여러 알고리듬을 알아본다. 전통적인 알고리듬인 시퀀스, 트리, 그래프 등을 사용해서 어떻게 자연어를 다루는지 설명한다.
엔지니어와 연구자들이 자연어 처리를 다루기 위해 필요한 언어학 지식에 대해서도 충분히 알아본다. 형태소, 품사에서 시작해서 구조적 표현으로 컴퓨터가 인식하기 위한 연산으로 적용되는지 설명하며, 언어에 대한 형식적인 논리를 위한 방법부터 단어 임베딩까지 의미를 표현하고 해석하는 방법을 다룬다. 마지막에는 문서에서 정보를 추출하는 방법, 기계 번역, 텍스트를 직접 생성하는 것까지 최근의 응용 사례에 대한 방법까지 빼놓지 않고 이야기한다.
결과적으로 이 책은 머신러닝과 언어학을 자연어 처리라는 하나의 목표 아래 통합하며, 최근의 자연어 처리 연구를 이해하고 적용할 수 있도록 만들어주기에 더할 나위 없는 책이다.

이 책의 총서 (110)

작가정보

저자(글) 제이콥 에이젠슈테인

(Jacob Eisenstein)
현재 구글에서 연구하고 있다. 구글에 합류하기 전에는 조지아공과대학교의 컴퓨터과학부(School of Interactive Computing)에서 교수로 재직했다.

번역 이동근

컴퓨터과학을 전공하던 중 소프트웨어 엔지니어의 길로 들어섰다. 채용과 아웃소싱 시장의 변화를 주도하고 있는 시소(seeso)를 창업했다. 수백 개의 프로젝트와 수백 명의 실무 전문가들과 작업하고 여러 업무 데이터를 활용해 프로젝트를 효율적으로 수행할 수 있는 여러 서비스를 개발했다. AI를 활용한 서비스를 꾸준히 개발하고 있으며, 팀으로 함께 일하며 성장하는 것에 관심이 많다. 여유가 있을 때는 사회 문제를 IT로 해결하는 여러 프로젝트를 수행하거나, 번역 작업을 한다. 오픈소스와 오픈소스가 가지는 문화에 존경심을 갖고 있다.

번역 김근호

김근호

한국외국어대학교에서 영어통번역과 중국지역학을 전공했다. 어릴 적부터 언어를 좋아했고, 언어학으로 시작한 관심이 프로그래밍 언어로 이어져 지금은 백엔드 개발자로 일하고 있다. 현재는 ERP 시스템을 개발한다. 지금도 언어에 관심이 많아 프로그래밍 언어와 함께 여러 언어를 학습하는 것이 취미다.

작가의 말

자연어 처리는 사람들의 언어를 컴퓨터가 다룰 수 있도록 만든 방법이다. 지난 10년 동안 자연어 처리는 우리 일상에 자연스럽게 스며들었다. 이미 기계 번역은 웹과 SNS 등에서 광범위하게 쓰이고 있고, 텍스트 분류 작업을 통해 메일함이 스팸 메일로 가득 차지 않도록 도와준다. 검색 엔진은 단순히 텍스트를 매칭해 찾는 것을 넘어섰으며, 언어의 아주 미묘한 차이를 다루는 높은 수준의 네트워크 분석도 이뤄진다. 대화 시스템은 굉장히 빠르게 보편화되고 있고, 정보를 얻고 유통하기에 굉장히 효율적인 도구로 사용되고 있다.
이런 다양한 애플리케이션은 공통적인 아이디어와 알고리듬, 언어학, 논리, 통계학 등을 바탕으로 만들어진다. 이 책은 이런 지식을 알아갈 수 있는 길잡이 역할을 하도록 집필했다.

목차

  • 1장. 개요
    1.1 자연어 처리와 그 이웃들
    1.2 자연어 처리의 세 가지 주제

    2장. 선형 텍스트 분류
    2.1 단어 가방
    2.2 나이브 베이즈
    2.3 결정 학습
    2.4 손실함수와 큰 마진 분류
    2.5 로지스틱 회귀
    2.6 최적화
    2.7 분류에서의 또 다른 주제들
    2.8 학습 알고리듬 요약

    3장. 비선형 분류
    3.1 피드포워드 뉴럴 네트워크
    3.2 뉴럴 네트워크 디자인하기
    3.3 뉴럴 네트워크 학습하기
    3.4 컨볼루셔널(합성곱) 뉴럴 네트워크

    4장. 언어 기반의 분류 응용
    4.1 감성 및 의견 분석
    4.2 단어 의미의 모호성
    4.3 텍스트 분류를 위한 의사 결정 디자인
    4.4 분류기 평가하기
    4.5 데이터 세트 만들기

    5장. 비지도 학습
    5.1 비지도 학습
    5.2 기댓값 최대화의 적용
    5.3 준지도 학습
    5.4 도메인 적응
    5.5 잠재변수가 있는 학습에 대한 여러 접근법

    6장. 언어 모델
    6.1 그램 언어 모델
    6.2 평활화와 할인하기
    6.3 순환 뉴럴 네트워크 언어 모델
    6.4 언어 모델 평가하기
    6.5 어휘집에 없는 단어

    7장. 시퀀스 라벨링
    7.1 분류에서의 시퀀스 라벨링
    7.2 구조 예측을 위한 시퀀스 라벨링
    7.3 비터비 알고리듬
    7.4 은닉 마르코프 모델
    7.5 피처를 사용한 결정하는 시퀀스 라벨링
    7.6 뉴럴 시퀀스 라벨링
    7.7 비지도 시퀀스 라벨링

    8장. 시퀀스 라벨링 응용
    8.1 품사 식별
    8.2 형태구문론적 속성
    8.3 개체명 인식
    8.4 토크나이제이션
    8.5 코드 스위칭
    8.6 대화 행위

    9장. 형식 언어론
    9.1 정규 언어
    9.2 문맥 자유 언어
    9.3 가벼운 문맥 의존 언어

    10장. 문맥 자유 파싱
    10.1 결정형 상향식 파싱
    10.2 모호성
    10.3 가중치가 있는 문맥 자유 문법
    10.4 가중치가 있는 문맥 자유 문법 학습하기
    10.5 문법 보정
    10.6 문맥 자유 파싱을 너머

    11장. 의존 파싱
    11.1 의존 문법
    11.2 그래프 기반 의존 파싱
    11.3 전이 기반 의존 파싱
    11.4 응용

    12장. 논리적 의미론
    12.1 의미와 표기
    12.2 의미의 논리적 표현
    12.3 의미 파싱과 람다 대수
    12.4 의미 파서 학습하기

    13장. 술어 인자 의미론
    13.1 의미 역할
    13.2 의미 역할 라벨링
    13.3 추상 의미 표현

    14장. 분포 의미와 분산 의미
    14.1 분포 가설
    14.2 단어 표현을 위한 디자인 결정
    14.3 잠재 의미 분석
    14.4 브라운 군집
    14.5 뉴럴 단어 임베딩
    14.6 단어 임베딩 평가하기
    14.7 분포 통계량 너머의 분포된 표현
    14.8 다중 단어 단위의 분포된 표현

    15장. 참조 해결
    15.1 참조 표현의 형태
    15.2 상호 참조 해결을 위한 알고리듬
    15.3 상호 참조 해결 표현하기
    15.4 상호 참조 해결 평가하기

    16장. 담화
    16.1 분절
    16.2 개체와 언급
    16.3 관계

    17장. 정보 추출
    17.1 개체
    17.2 관계
    17.3 사건
    17.4 헤지, 부정, 가정
    17.5 질의 응답과 기계 독해

    18장. 기계 번역
    18.1 기계 번역 작업
    18.2 통계적 기계 번역
    18.3 뉴럴 기계 번역
    18.4 디코딩
    18.5 평가 지표 훈련

    19장. 텍스트 생성
    19.1 데이터를 통한 텍스트 생성
    19.2 텍스트를 통한 텍스트 생성
    19.3 대화

    부록 A. 확률
    A.1 사건 조합의 확률
    A.2 조건부 확률과 베이즈 규칙
    A.3 독립
    A.4 확률변수
    A.5 기댓값
    A.6 모델링과 추정

    부록 B. 수치 최적화
    B.1 경사 하강
    B.2 제약 조건이 있는 최적화
    B.3 예시: 수동적 - 능동적 온라인 학습

추천사

출판사 서평

◈ 이 책에서 다루는 내용 ◈

이 책은 자연어 처리의 다양한 핵심 개념을 다룬다. 자연어 처리 작업을 위한 수많은 문제는 다음의 여러 방법을 사용해 해결할 수 있다.

◆ 탐색: 비터비 탐색, CKY 알고리듬, 스패닝 트리, 이동 감소, 정수 선형 프로그래밍, 빔 탐색
◆ 학습: 최대 우도 추정, 로지스틱 회귀, 퍼셉트론, 기댓값 - 최대화, 행렬 분해, 역전파

이 책에서는 이러한 방법들이 어떻게 동작하는지 설명하고, 광범위한 자연어 처리 작업에 어떻게 적용할 수 있을지 다뤄본다. 또한 문서 분류, 단어 의미 모호성, 품사 태깅, 개체명 인식, 파싱, 상호 참조 해결, 관계 추출, 담화 분석, 언어 모델링, 기계 번역 등과 같은 여러 자연어 처리 작업에 대해서 함께 다룬다.

◈ 이 책의 대상 독자 ◈

어느 정도 소프트웨어 지식이 있는 엔지니어와 대학원생 수준 이상의 연구자들에게 적합한 책이다. 각 장은 서로 독립돼 있지만 어느 순간 자연스레 통합되도록 구성됐다. 필요한 부분만 찾아서 읽어도 좋고, 전체를 하나씩 훑으며 큰 줄기를 잡는 것도 좋다.

◈ 이 책의 구성 ◈

기본적인 내용을 익힌 후, 다음의 4개 주요 영역을 다룬다.
◆ 학습: 다른 섹션에서 사용되는 여러 머신러닝 툴을 만들어볼 것이다. 머신러닝에 초점을 맞춰서 설명하기 때문에 텍스트 표현이나 언어학적인 현상들은 대부분 간단하다. “bag-of-words” 텍스트 분류를 예시 모델로 다룰 것이다. 4장에서는 단어 기반의 텍스트 분석에 관해 언어학적으로 흥미로운 응용 방법을 설명한다.
◆ 시퀀스와 트리: 언어를 구조학적인 현상에 비춰 설명하는 섹션이다. 시퀀스 및 트리 표현과 이들이 만들어내는 알고리듬에 대해 다루고 이러한 표현에서 발생되는 한계점에 대해서 설명한다. 9장에서는 유한 상태 오토마타(finite-state automata)에 대해 소개하고, 영어 구문론에서의 문맥 자유 언어를 짧게 소개한다.
◆ 의미: 형식 논리에서부터 뉴럴 단어 임베딩까지 텍스트를 통해 의미를 표현하고, 계산하기 위한 내용을 다룬다. 의미론과 밀접하게 관련 있는 참조 모호성을 해결하기 위한 방법과 담화 구조에서의 다문장 분석에 대한 두 가지 주제 등을 다룬다.
◆ 응용: 자연어 처리에 대한 주요한 응용 문제인 정보 추출, 기계 번역, 텍스트 생성에 대해 설명한다. 각 장에서 뉴럴 어텐션과 같은 방법을 소개하면서 이 책의 앞부분에서 구축한 형식과 방법을 사용해 가장 잘 알려진 시스템 중 일부를 설명한다.

◈ 옮긴이의 말 ◈

공부하던 강의(NLP 224n)에서 이 책을 처음 만난 후로, 실무를 하다가 이해 안 가는 부분을 찾아보며 일주일 동안 다섯 번 정도 이 책과 저자가 쓴 글을 마주했을 때 느꼈던 운명 같은 느낌을 아직도 간직하고 있습니다. 그러고 나서 운이 좋게도 이 책을 번역할 기회가 주어졌을 때는 운명이지 않을까 생각했습니다.
어느 책이나 번역하는 일은 항상 하늘이 내린 일이라고 생각하지만, 자연어 책을 참고하며 번역하는 일은 더욱 숙명적이고도 어려운 일이었습니다. 실력이 부족한 점도 없지 않아 있었겠지만 익숙하지 않은 언어학적인 관점을 충분히 이해하고 번역해야 하기 때문입니다. 모국어도 언어학적인 관점에서 보는 한글과 실제로 사용하는 한국어가 다릅니다. 또 한글로 쓰인 수필, 소설, 에세이, 기사 등의 문장에서 느껴지는 작은 묘미를 독자들은 크게 느끼지만, 짧은 문장에도 숨겨진 문법성의 의미와 언어학적 의미를 살려서 번역하는 것은 정말 힘든 일이었습니다.
이 책은 자연어 처리의 정석이라고도 할 수 있는 교과서 스타일의 책입니다. 한국어로 잘 설명된 교과서를 보는 것도 상당한 에너지가 필요하고, 시작하기 전 마음을 다잡아야 하는데 이런 어려운 면면을 다 가진 책이라니, 이 책을 펼쳐 든 독자들도 앞으로의 길이 쉽지 않으리라 생각합니다.
하지만 확언하건대 이 책은 자연어 처리에 관한 가장 탁월하게 설명하며, 끝까지 읽으면 실력을 굉장히 향상시켜줄 것입니다. 실력이 어느 정도 쌓인 후, 실무에 적용하는 수준이 되고 나면 각각으로 쪼개져 있는 지식의 양을 더 넓히는 동시에 합칠 줄 알아야 한다고 생각합니다. 또 알고 있는 지식 사이에 듬성듬성 나 있는 구멍을 메워야 하는 시기가 온다고 생각합니다. 그런 과정에 있다면 이 책은 최고의 책입니다. 자연어 처리 분야의 일부만 연구했더라도, word2vec과 BERT를 사용하며 실무의 한 부분에만 익숙하더라도, 20년 전의 검색 엔진 분석을 위한 텍스트 파싱에만 익숙한 모든 분께 더 넓은 시야와 깊은 지식을 얻을 수 있는 책이리라 확신합니다.

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수, 시리즈명을(를) 나타낸 표입니다.
ISBN 9791161756455
발행(출시)일자 2022년 05월 30일
쪽수 690쪽
크기
188 * 235 * 39 mm / 1344 g
총권수 1권
시리즈명
데이터 과학

Klover

구매 후 리뷰 작성 시, e교환권 200원 적립

데이터를 불러오는 중입니다.

문장수집 (0)

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여주는 교보문고의 새로운 서비스입니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 "좋아요“ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보 없이 삭제될 수 있습니다.
리워드 안내
구매 후 90일 이내에 문장수집 작성 시 e교환권 100원을 적립해드립니다.
e교환권은 적립 일로부터 180일 동안 사용 가능합니다. 리워드는 작성 후 다음 날 제공되며, 발송 전 작성 시 발송 완료 후 익일 제공됩니다.
리워드는 한 상품에 최초 1회만 제공됩니다.
주문취소/반품/절판/품절 시 리워드 대상에서 제외됩니다.
판매가 5,000원 미만 상품의 경우 리워드 지급 대상에서 제외됩니다. (2024년 9월 30일부터 적용)

구매 후 리뷰 작성 시, e교환권 100원 적립

이 책의 첫 기록을 남겨주세요.

교환/반품/품절 안내

  • 반품/교환방법

    마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환 신청, [1:1 상담 > 반품/교환/환불] 또는 고객센터 (1544-1900)
    * 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900)
  • 반품/교환가능 기간

    변심반품의 경우 수령 후 7일 이내,
    상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
  • 반품/교환비용

    변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 반품/교환 불가 사유

    1) 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
    (단지 확인을 위한 포장 훼손은 제외)
    2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
    예) 화장품, 식품, 가전제품(악세서리 포함) 등
    3) 복제가 가능한 상품 등의 포장을 훼손한 경우
    예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
    4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
    5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
    6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
    7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
    8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
    9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등
  • 상품 품절

    공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
  • 소비자 피해보상 환불 지연에 따른 배상

    1) 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
    2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

TOP