Глубокое обучение с подкреплением: теория и практика на языке Python

Артикул: 19270
Нет в наличии
2 557

Описание

Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Прочитав эту книгу, вы:

  • Разберетесь в каждом ключевом аспекте задач глубокого RL.
  • Исследуете алгоритмы на основе стратегий и полезности, включая REINFORCE, SARSA, DQN, двойную DQN и приоритетное повторение опыта (PER).
  • Углубитесь в комбинированные алгоритмы, такие как метод актора-критика и приближенная оптимизация стратегий (РРО).
  • Узнаете, как выполнять синхронную и асинхронную параллелизацию.
  • Научитесь выполнять алгоритмы глубокого RL в SLM LAB и изучите практические аспекты их реализации.
  • Исследуете результаты тестов производительности с отрегулированными гиперпараметрами.
  • Узнаете, как разрабатываются среды для глубокого RL.

Об авторах:

Лаура Грессер — программист-исследователь, занимается робототехникой в Google. Она окончила Нью-Йоркский университет, получив степень магистра со специализацией в машинном обучении.
Ван Лун Кенг — разработчик в сфере искусственного интеллекта, работает в компании Machine Zone, где применяет глубокое обучение с подкреплением к задачам промышленного уровня.

Характеристики

Автор(ы)Лаура Грессер, Ван Лун Кенг
ПереводчикК. Синица
ИздательствоПитер
СерияБиблиотека программиста
Год выпуска2022
ISBN978-5-4461-1699-7
Возрастное ограничение16+
Кол-во страниц416
Формат страниц70x100/16 (170x240 мм)
ЯзыкРусский
ПереплётМягкий
Доп. сведенияОфсетная бумага
Иллюстрациичерно-белые
Тираж500 экз.
Вес655 г

Отзывы посетителей(0)

Наверх