Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах.Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Грокаем глубокое обучение с подкреплением
Искусство и искусствоведениеМы тянемся ко всему, что дает нам успех, позволяет получить награду или удовольствие. Эта общая закономерность является основой глубокого обучения с подкреплением: системы обучения, которые исследуют и учатся на основе реакции окружающей среды.
$45.99
| Вес | 25.2 унция |
|---|---|
| Габариты | 21.59 × 14.48 × 2.54 дюйм |
| формат | 70×100/16 |
| SKU | К30596 |
| Серия | |
| переплет | Мягкий переплет |
| Автор | |
| стандарт | 10 |
| дата-получения | 14.06.2023 |
| Год выпуска | |
| Издательство | |
| количество-страниц | 464 |
| формат-ммсм | 170×240 |
| Иллюстраторы | |
| тираж | 200 |
| handling_time | 21 days |
| ISBN | 978-5-4461-3944-6 |
| EAN | 9785446139446 |







