Глубокое обучение с подкреплением: теория и практика на языке Python

Описание

Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Прочитав эту книгу, вы:

Разберетесь в каждом ключевом аспекте задач глубокого RL.
Исследуете алгоритмы на основе стратегий и полезности, включая REINFORCE, SARSA, DQN, двойную DQN и приоритетное повторение опыта (PER).
Углубитесь в комбинированные алгоритмы, такие как метод актора-критика и приближенная оптимизация стратегий (РРО).
Узнаете, как выполнять синхронную и асинхронную параллелизацию.
Научитесь выполнять алгоритмы глубокого RL в SLM LAB и изучите практические аспекты их реализации.
Исследуете результаты тестов производительности с отрегулированными гиперпараметрами.
Узнаете, как разрабатываются среды для глубокого RL.

Об авторах:

Лаура Грессер — программист-исследователь, занимается робототехникой в Google. Она окончила Нью-Йоркский университет, получив степень магистра со специализацией в машинном обучении.
Ван Лун Кенг — разработчик в сфере искусственного интеллекта, работает в компании Machine Zone, где применяет глубокое обучение с подкреплением к задачам промышленного уровня.

Характеристики

Автор(ы)	Лаура Грессер, Ван Лун Кенг
Переводчик	К. Синица
Издательство	Питер
Серия	Библиотека программиста
Год выпуска	2022
ISBN	978-5-4461-1699-7
Возрастное ограничение	16+
Кол-во страниц	416
Формат страниц	70x100/16 (170x240 мм)
Язык	Русский
Переплёт	Мягкий
Доп. сведения	Офсетная бумага
Иллюстрации	черно-белые
Тираж	500 экз.
Вес	655 г

Отзывы посетителей(0)