Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах.Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Грокаем глубокое обучение с подкреплением
Искусство и искусствоведениеМы тянемся ко всему, что дает нам успех, позволяет получить награду или удовольствие. Эта общая закономерность является основой глубокого обучения с подкреплением: системы обучения, которые исследуют и учатся на основе реакции окружающей среды.
$47.99
Вес | 28 унция |
---|---|
Габариты | 8.5 × 5.7 × 1.0 дюйм |
Формат | 70×100/16 |
Издательство | |
Серия | |
Переплет | Мягкий переплет |
Автор | |
Стандарт | 4 |
Дата получения | 14.06.2023 |
Год выпуска | |
Количество страниц | 464 |
SKU | 302966 |
Формат, мм\см | 165x233x24 |
Иллюстраторы | |
Тираж | 1200 |