<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Лапань Максим &#8212; Knigausa Bookstore: Russian Books</title>
	<atom:link href="https://knigausa.com/%D0%B0%D0%B2%D1%82%D0%BE%D1%80/%d0%bb%d0%b0%d0%bf%d0%b0%d0%bd%d1%8c-%d0%bc%d0%b0%d0%ba%d1%81%d0%b8%d0%bc/feed/" rel="self" type="application/rss+xml" />
	<link>https://knigausa.com</link>
	<description>Just another WordPress site</description>
	<lastBuildDate>Fri, 27 Feb 2026 17:38:09 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.7.5</generator>
	<item>
		<title>Глубокое обучение с подкреплением. AlphaGo и другие технологии</title>
		<link>https://knigausa.com/product/%d0%b3%d0%bb%d1%83%d0%b1%d0%be%d0%ba%d0%be%d0%b5-%d0%be%d0%b1%d1%83%d1%87%d0%b5%d0%bd%d0%b8%d0%b5-%d1%81-%d0%bf%d0%be%d0%b4%d0%ba%d1%80%d0%b5%d0%bf%d0%bb%d0%b5%d0%bd%d0%b8%d0%b5%d0%bc-alphago-%d0%b8/</link>
		
		<dc:creator><![CDATA[]]></dc:creator>
		<pubDate>Mon, 27 May 2024 13:40:06 +0000</pubDate>
				<guid isPermaLink="false">https://knigausa.com/product/%d0%b3%d0%bb%d1%83%d0%b1%d0%be%d0%ba%d0%be%d0%b5-%d0%be%d0%b1%d1%83%d1%87%d0%b5%d0%bd%d0%b8%d0%b5-%d1%81-%d0%bf%d0%be%d0%b4%d0%ba%d1%80%d0%b5%d0%bf%d0%bb%d0%b5%d0%bd%d0%b8%d0%b5%d0%bc-alphago-%d0%b8/</guid>

					<description><![CDATA[Вводная книга о глубоком обучении с подкреплением (Reinforcemet Learning)]]></description>
										<content:encoded><![CDATA[<p>Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.В этой книге- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.- Изучите основу RL: марковские процессы принятия решений.- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.- Реализуете метод AlphaGo Zero для игры в Connect4.- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">823633</post-id>	</item>
	</channel>
</rss>
