Описание
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Прочитав эту книгу, вы:
- Разберетесь в каждом ключевом аспекте задач глубокого RL.
- Исследуете алгоритмы на основе стратегий и полезности, включая REINFORCE, SARSA, DQN, двойную DQN и приоритетное повторение опыта (PER).
- Углубитесь в комбинированные алгоритмы, такие как метод актора-критика и приближенная оптимизация стратегий (РРО).
- Узнаете, как выполнять синхронную и асинхронную параллелизацию.
- Научитесь выполнять алгоритмы глубокого RL в SLM LAB и изучите практические аспекты их реализации.
- Исследуете результаты тестов производительности с отрегулированными гиперпараметрами.
- Узнаете, как разрабатываются среды для глубокого RL.
Об авторах:
Лаура Грессер — программист-исследователь, занимается робототехникой в Google. Она окончила Нью-Йоркский университет, получив степень магистра со специализацией в машинном обучении.
Ван Лун Кенг — разработчик в сфере искусственного интеллекта, работает в компании Machine Zone, где применяет глубокое обучение с подкреплением к задачам промышленного уровня.
Характеристики
Автор(ы) | Лаура Грессер, Ван Лун Кенг |
Переводчик | К. Синица |
Издательство | Питер |
Серия | Библиотека программиста |
Год выпуска | 2022 |
ISBN | 978-5-4461-1699-7 |
Возрастное ограничение | 16+ |
Кол-во страниц | 416 |
Формат страниц | 70x100/16 (170x240 мм) |
Язык | Русский |
Переплёт | Мягкий |
Доп. сведения | Офсетная бумага |
Иллюстрации | черно-белые |
Тираж | 500 экз. |
Вес | 655 г |