바닥부터 배우는 강화 학습

강화 학습 기초에 대한 쉽고 정확한 개념 설명

노승은 저자(글)

영진닷컴 · 2020년 09월 15일

주간베스트

컴퓨터/IT 532위

9.9

10점 중 9.9점

(17개의 리뷰)

집중돼요 (38%의 구매자)

A4

사이즈 비교

210x297

바닥부터 배우는 강화 학습 사이즈 비교 153x225

단위 : mm

01 / 02

MD의 선택 무료배송 이벤트 소득공제

10% 19,800원 ~~22,000원~~

적립/혜택

1,100P

배송안내

무료배송

새벽배송 내일(4/12,토 오전 7시 전) 도착

기본배송지 기준

로그인 후 정확한 배송 안내를 받아보세요!

이달의 꽃과 함께 책을 받아보세요!

1권 구매 시 결제 단계에서 적용 가능합니다.

이벤트
상품정보
리뷰 (17)
교환/반품/품절

이 책의 이벤트

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

ChatGPT 추천도서 모음전

2023/02/22 ~ 2030/02/22

함께 구매한 상품

도서

나도 하는 파이썬 데이터 분석김규석. 김현정
19,800원
파이토치와 유니티 ML-Agents로 배우는 강화학습(응용편)민규식. 이현호. 박유민
34,200원
파이썬으로 시작하는 데이터 분석강지영
19,800원
딥러닝 프로젝트를 위한 허깅페이스 실전 가이드윤대희. 김동화. 송종민. 진현두
28,800원
인공지능 주식투자 좀 부탁해곽경일
22,500원
그림으로 배우는 AI미츠무라 나오키. 양성건
15,300원
강화학습 기본과 PyTorch추상목
22,000원
101가지 문제로 배우는 딥러닝 허깅페이스 트랜스포머 with 파이토치조슈아 K. 케이지. 임선집. 채호창
23,400원
그림으로 배우는 StatQuest 머신러닝 강의조시 스타머. 김태헌
24,300원
Do it! BERT와 GPT로 배우는 자연어 처리이기창
18,000원
파이썬 딥러닝 파이토치(Python Deep Learning PyTorch)이경택. 방성수. 안상준
22,500원
파이토치로 배우는 자연어 처리델립 라오. 브라이언 맥머핸. 박해선
23,400원
단단한 심층강화학습로라 그레서. 와룬켕. 김성우
27,000원
머신러닝 시스템 구축 실전 가이드시부이 유스케. 김모세
26,100원
컴퓨터 비전과 딥러닝오일석
39,000원

라이프

코끼리 색연필 1287 12색 프로모션 세트(10+2)
14,000원
휴대용 독서대 지스탠드 북 블랙
23,000원
플랜룩스 폴드 높이조절 2단 책 거치대 받침대 독서대
29,900원
노르잇 투명독서대 높이조절 PR01A
28,900원
펜텔 스매쉬 Q1005 0.5mm 샤프펜슬[00015692]
12,800원
파란 마음 북커버
21,500원
THE READER 북커버
22,500원
독서대 위너항균독서대 60SE양방향필기 2단독서대
34,400원
[무료각인] LOG IP-805 무한연필 만년연필 원목각인펜
10,500원
제주 삼다수 2L / 500ml / 330ml 생수 모음전-무라벨 2L x 12pet (재고 부족시 유라벨)
12,960원
[펜텔] 그래프1000 샤프(0.3/0.5/0.7/0.9)-그래프1000/0.5mm
14,400원
텐미닛 플래너 HALF YEAR - 다크호스
12,900원
3 오이스터스 헌터스 만년필 기프트 세트-나이트 블랙
39,600원
맥심 커피믹스 100T/화이트 모카 아라비카 슈프림-07.맥심 슈프림골드 100T
23,700원
레토 무선 집게 듀얼 LED 책상 스탠드 LLU-DC18-LLU-DC18
25,900원

키워드 Pick

책 소개

이 책이 속한 분야

강화 학습 기초 이론부터 블레이드 & 소울 비무 AI 적용까지
이 책은 강화 학습을 모르는 초보자도 쉽게 이해할 수 있도록 도와주는 입문서입니다. 현업의 강화 학습 전문가가 직접 설명해 강화 학습에 가장 기본이 되는 개념 설명부터 실무 사례까지 한 권으로 정리했습니다.
강화 학습의 뼈대가 되는 MDP부터 딥러닝과 강화 학습이 만나는 지점 및 학습 방법론, 알파고, 알파고 제로까지 다룹니다. 나아가 유명 게임인 블레이드&소울 비무에 실제로 강화 학습을 적용하며 실무에서 얻은 팁과 노하우를 배워봅니다.

작가정보

저자(글) 노승은

민족사관고등학교 졸업
서울대학교 자유전공학부 컴퓨터공학/경제학 전공
서울대학교 융합과학기술대학원 석사
현) 엔씨소프트 GameAI랩 강화 학습 연구원
현) 강화 학습 유튜브 채널 “팡요랩” 운영

Chapter 1. 강화 학습이란
Chapter 2. 마르코프 결정 프로세스
Chapter 3. 벨만 방정식
Chapter 4. MDP를 알 때의 플래닝
Chapter 5. MDP를 모를 때 밸류 평가하기
Chapter 6. MDP를 모를 때 최고의 정책 찾기
Chapter 7. Deep RL 첫걸음
Chapter 8. 가치 기반 에이전트
Chapter 9. 정책 기반 에이전트
Chapter 10. 알파고와 MCTS
Chapter 11. 블레이드&소울 비무 AI 만들기

출판사 서평

[구성 소개]
Chapter 1. 강화 학습이란
바둑에서 시작하여 게임, 금융, 로봇까지 수많은 분야에서 강화학습을 통해 전례 없는 수준의 AI가 만들어졌습니다. 기존 학습 방법론과 어떤 차이가 있었기에 이런 도약이 가능했을까요? 그에 대한 답은 강화 학습이 무엇인가라는 작은 이야기부터 시작합니다.

Chapter 2. 마르코프 결정 프로세스
문제를 풀기 위해서는 먼저 문제가 잘 정의되어야 합니다. 강화 학습에서 문제를 잘 정의하려면 주어진 문제를 MDP(Markov Decision Process)의 형태로 만들어야 합니다. MDP에 대해 속속들이 알아봅니다.

Chapter 3. 벨만 방정식
대부분의 강화 학습 알고리즘은 밸류를 구하는 것에서 출발합니다. 그리고 밸류를 구하는 데 뼈대가 되는 수식이 바로 벨만 방정식입니다. 벨만 기대 방정식과 벨만 최적 방정식이라는 두 종류의 방정식을 배워봅니다.

Chapter 4. MDP를 알 때의 플래닝
벨만 방정식 학습으로 간단한 MDP를 풀 수 있습니다. 벨만 방정식을 반복적으로 적용하는 방법론을 통해 아주 간단한 MDP를 직접 풀어봅니다.

Chapter 5. MDP를 모를 때 밸류 평가하기
MDP의 전이 확률과 보상 함수를 모를 때에 대한 이야기가 시작됩니다. 주어진 수식을 이용해 정확한 값을 계산하는 대신, 수많은 샘플을 통해 근사하는 “샘플 기반 방법론”을 배워봅니다.

Chapter 6. MDP를 모를 때 최고의 정책 찾기
Control 문제를 해결할 차례입니다. 밸류를 계산할 수 있기 때문에 이를 이용해 정책을 찾는 것은 한결 쉽습니다. 그 유명한 Q러닝을 배워봅니다.

Chapter 7. Deep RL 첫걸음
커다란 MDP의 세계를 항해하기 위해서 우리에게는 또 다른 무기가 하나 필요합니다. 바로 “딥러닝” 입니다. 딥러닝과 강화 학습이 만나 Deep RL이라는 유연하고도 범용적인 방법론이 탄생합니다. 먼저 딥러닝에 대한 이야기부터 시작합니다.

Chapter 8. 가치 기반 에이전트
신경망을 이용해 액션 밸류 네트워크를 학습하면 그게 곧 하나의 에이전트가 될 수 있습니다. 아타리 게임을 플레이 하던 DQN이 바로 이 방식입니다. 가치 함수만을 가지고 움직이는 에이전트, 즉 가치 기반 에이전트에 대해 알아보겠습니다.

Chapter 9. 정책 기반 에이전트
딥러닝과 정책 함수가 결합하면 강력한 정책 네트워크를 만들어 냅니다. 보상 및 밸류 네트워크를 이용해 직접적으로 정책 네트워크를 학습하는 방법에 대해 알아보겠습니다. 이는 수많은 최신 강화 학습 알고리즘의 뿌리가 되는 방법론입니다.

Chapter 10. 알파고와 MCTS
인류 최고의 바둑 기사를 이긴 AI를 만드는 과정도 분해해서 생각하면 간단한 방법론들의 조합입니다. 이제 한 걸음만 더 가면 알파고를 완전히 이해할 수 있습니다. 그 마지막 한 조각인 MCTS를 소개하고, 이를 통해 알파고를 낱낱이 분해합니다.
Chapter 11. 블레이드&소울 비무 AI 만들기
복잡한 실시간 격투 게임에 강화 학습을 적용하는 일은 어떤 과정을 거칠까요? 블레이드&소울에 강화 학습을 적용하여 에이전트를 학습시키는 과정과 시행착오에 대해 소개합니다.

기본정보

상품정보 테이블로 ISBN, 발행(출시)일자 , 쪽수, 크기, 총권수을(를) 나타낸 표입니다.
ISBN	9788931463170
발행(출시)일자	2020년 09월 15일
쪽수	304쪽
크기	153 * 225 * 20 mm / 571 g
총권수	1권

Klover 리뷰 (17)

구매 후 리뷰 작성 시, e교환권 200원 적립

사용자 총점

10점 중 9.9점

10점 중 10점

94%

10점 중 7.5점

10점 중 5점

10점 중 2.5점

38%의 구매자가
집중돼요 라고 응답했어요

38%

집중돼요

19%

도움돼요

쉬웠어요

19%

최고예요

19%

추천해요

종이책구매자de******** | 2021.01.27 |

10점 중 10점

/집중돼요

강화학습 이해를 위해 입문 책을 여러권 구매했는데 그중에 이 책이 가장 이해하기 쉽게 써놓은 책이네요. 내용을 너무 줄이지도 늘리지도않고 딱 적당한 것 같습니다

종이책구매자jo******** | 2024.06.16 |

10점 중 10점

/추천해요

유익한 책으로 도움 많이 받았습니다

종이책구매자ju******** | 2023.03.09 |

10점 중 10점

/집중돼요

가격도 저렴하고 책 내용도 좋습니다.

종이책구매자ak***** | 2022.08.30 |

10점 중 10점

/최고예요

힘조절을 적절히 하면서도 이론의 핵심을 직관적으로 놀라울 정도로 잘 전달하고 있습니다.

종이책구매자ti****** | 2021.08.19 |

10점 중 10점

/집중돼요

다른 강화학습 도서에 비해서 잘 읽히고 이해하기 쉽습니다.

종이책구매자or****** | 2021.05.26 |

10점 중 10점

/도움돼요

강화학습 기초를 쌓을 수 있어요

종이책구매자ky**** | 2021.01.05 |

10점 중 10점

/도움돼요

사이즈는 작은데 내용은 단단한 듯 합니다

종이책구매자to***** | 2021.01.02 |

10점 중 10점

/집중돼요

종이책구매자na******* | 2020.12.11 |

10점 중 10점

/도움돼요

시중에 나와 있는 한글로 쓰여진 강화학습 책 중에 최고입니다. 처음 입문시에 큰 그림을 그리기 좋아요. 코드 실습도 원리 이해하기에 적당하고. 완전 추천

종이책구매자na******** | 2020.11.06 |

10점 중 10점

/집중돼요

유투브의 내용을 잘 요약되어 있고, 깔금해서 도움이 되었습니다.

문장수집 (1)

구매 후 리뷰 작성 시, e교환권 100원 적립

세사에 순차적 의사결정 문제는 정말 많고 다양합니다.

바닥부터 배우는 강화 학습

교보문고

ju******** | 2023.03.09 |

교환/반품/품절 안내

반품/교환 신청 1:1 문의

반품/교환방법

마이룸 > 주문관리 > 주문/배송내역 > 주문조회 > 반품/교환 신청, [1:1 상담 > 반품/교환/환불] 또는 고객센터 (1544-1900)
* 오픈마켓, 해외배송 주문, 기프트 주문시 [1:1 상담>반품/교환/환불] 또는 고객센터 (1544-1900)
반품/교환가능 기간

변심반품의 경우 수령 후 7일 이내,
상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
반품/교환비용

변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유

1) 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
(단지 확인을 위한 포장 훼손은 제외)
2) 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
3) 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
4) 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
5) 디지털 컨텐츠인 ebook, 오디오북 등을 1회이상 ‘다운로드’를 받았거나 '바로보기'로 열람한 경우
6) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
7) 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
8) 세트상품 일부만 반품 불가 (필요시 세트상품 반품 후 낱권 재구매)
9) 기타 반품 불가 품목 - 잡지, 테이프, 대학입시자료, 사진집, 방통대 교재, 교과서, 만화, 미디어전품목, 악보집, 정부간행물, 지도, 각종 수험서, 적성검사자료, 성경, 사전, 법령집, 지류, 필기구류, 시즌상품, 개봉한 상품 등
상품 품절

공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
소비자 피해보상 환불 지연에 따른 배상

1) 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
2) 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

기분 좋은 발견

이 분야의 베스트

1 이지패스 2025 ADsP 데이터분석 준전문가 전용문 외 1명
10% 27,000 원
2 2025 해커스 전산회계 1급 이론+실무+최신기출+무료특강 이남호
10% 27,000 원
3 진짜 쓰는 실무 엑셀 오빠두(전진권)
10% 18,900 원
4 해커스 전산세무 2급 이론+실무+최신기출 12회분 이남호
10% 28,800 원
5 2025 수제비 정보처리기사 실기 Final 실전 모의고사 윤영빈 외 3명
10% 28,800 원

이 분야의 신간

구글 코랩으로 배우는 인공지능 기술 아즈마 유키나가
10% 37,080 원
미드저니 마스터 바이블 조남경
10% 29,700 원
AI 낙관론과 비관론(큰글자책) 유화선 외 1명
10% 22,500 원
AI 낙관론과 비관론 유화선 외 1명
10% 10,800 원
진짜 챗GPT 활용법 김준성 외 2명
10% 18,000 원

총 상품 금액 19,800 원

선물하기

바로드림 바로구매

결제 완료 시간	도착예정일
평일 0시 ~ 12시 12시~22시	오늘 내일 07시 이전 새벽배송
토요일 및 휴일 전날 0시~11시 11시~20시	오늘 내일
일요일 및 휴일 0시~18시	내일

결제 완료 시간	도착예정일
평일 0시~20시	내일
토요일 및 휴일 전날 0시~20시	내일
일요일 및 휴일 0시~18시	내일

리뷰구분	구매 리뷰		한달 후 리뷰
대상상품	도서, 비도서(교보Only) 상품	핫트랙스 상품	도서, 비도서(교보Only) 상품
작성기한	구매 후 90일 이내		배송 완료 후 30일~120일 이내에 작성된 두 번째 구매 리뷰
작성조건	평점(필수) + 10자 이상 작성(필수) + 이미지 첨부(선택)
리워드	e교환권 200원 (eBook: 100원)	통합포인트: 100p 이미지 첨부 시, 200p	e교환권 100원 (eBook, 핫트랙스 해당없음)
리워드 지급시점	리뷰 작성 후 다음 날 지급 * 발송 전 작성 시, 발송 완료 후 다음날 지급 * eBook, 오디오북, 동영상 : "다운로드" 또는 "바로보기" 완료 후 리뷰 작성 시 익일 지급		리뷰 작성 후 다음 날 지급
사용기한	지급 후 180일 이내	지급 후 365일 이내	지급 후 180일 이내
리워드 지급조건	구매한 ID 당 한 상품에 최초 1회 작성 건만 리워드 지급
리워드 지급제외	- 주문 후 90일 이후 리뷰 작성 건 - 판매가 5,000원 미만 상품 (2024년 9월 30일부터 적용) - 교보문고: 강연, 공연, 여행, 동영상, 사은품, 기프트카드 - eBook: sam 이용권 구매 상품, 선물 받은 eBook - 핫트랙스: CD/DVD 상품 - 매장 구매 영수증 후적립 뒤에 작성한 리뷰건

대상상품	펀딩 프로젝트
작성기한	구매 완료 ~ 배송 완료 후 21일 이내
작성조건	100자 이상 or 사진 첨부 + 50자 이상 작성
리워드	프로젝트 기한 내 달성한 총 펀딩 달성 금액 별 참여 금액에 따라 지급되는 통합포인트가 달라집니다.(참여금액은 배송비 제외) 예시1. 100만원 이상 달성한 경우, 참여 금액의 5% 지급 예시2. 30만원 초과 50만원 이하 달성한 경우, 참여금액의 3% 지급 *예시3. 30만원 이하 달성한 경우 참여금액의 1% 지급
리워드 지급시점	리뷰 작성 후 다음 날 지급 * 상품 발송 전 작성 시, 발송 완료 후 다음날 지급 * 주문번호 별 최초 1회 작성한 건만 리워드 지급
사용기한	지급 후 365일 이내
리워드 지급제외	- 펀딩에 미달성한 프로젝트 - 구매 리뷰와 펀딩 리뷰 리워드는 중복지급되지 않습니다. - 적합하지 않은 내용의 리뷰를 작성하신 경우 리워드 지급되지 않으며, 부정적인 방법을 통해 지급된 리워드는 사전동의 없이 회수 될 수 있습니다.

바닥부터 배우는 강화 학습

이 책의 이벤트

패키지

함께 구매한 상품

키워드 Pick

책 소개

작가정보

저자(글) 노승은

목차

추천사

출판사 서평

기본정보

교환/반품/품절 안내

수도권 외 지역

배송 유의사항

바로드림존에서 받기

이용 안내

수령 안내

취소/교환/반품 안내

사은품 관련 안내

해외주문양서 배송지연 안내

Klover리뷰 안내