Официальный магазин издательской группы ЭКСМО-АСТ
Доставка
8 (800) 333-65-23
Часы работы:
с 8 до 20 (МСК)

Лапань Максим: Глубокое обучение с подкреплением. AlphaGo и другие технологии

Артикул: p5775587

Купили 23 раза

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 1
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 2
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 3
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 4
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 5
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 6
Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото 7

О товаре

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.

Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.

В этой книге:

• Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.

• Изучите основу RL: марковские процессы принятия решений.

• Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.

• Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.

• Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.

• Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.

• Реализуете метод AlphaGo Zero для игры в Connect4.

• Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Характеристики

ISBN:
Возрастное ограничение:
16+
Год издания:
2020
Количество страниц:
496
Переплет:
Мягкий переплёт
Бумага:
офсет
Формат:
164x233 мм
Вес:
0.63 кг

Ирина Колыбельская

4
Познакомился с кодом к главе 8. Заметное число критических ошибок. Код с листа не проходит, нужны исправления. Подключение некоторых, необходимых для выполнения кода пакетов опущено. Приходится восстанавливать по факту ошибок и с поиском в сети. Запуск кода из командной строки приведен только для одного скрипта. Все остальные аргументы параметры запуска пришлось вычислять анализом кода. Удивило, что критерием остановки цикла принят np.inf и в коде train_model.py и в коде train_model_conv.py. Содержание файла requirements.txt, которое определяет необходимый софт для работы с книгой - некорректно. Приходится достаточно долго подбирать вручную, без шансов для новичков. Предоставленные скрипты в неудовлетворительном состоянии. Текстовая часть книги сжата, но представляет интерес принятой манерой изложения. В английском варианте книги этот пример уже в главе 10 количество недочетов никак не меньше, прежние сохранились.

Войдите или зарегистрируйтесь, чтобы получить скидку 30% на первый заказ