Введение в методы машинного обучения с подкреплением: учебное пособие
Панов А. И.

Рассмотрены основные понятия и алгоритмы машинного обучения с подкреплением – активно развивающегося направления в искусственном интеллекте. На основе материалов лекций, читаемых автором в МФТИ и Высшей школе экономики, представлены основные методы обучения с подкреплением: методы динамического программирования, метод временных различий, градиентные и иерархические методы. Особое внимание уделено рассмотрению алгоритмических аспектов указанных подходов, приводятся иллюстративные примеры и отмечаются основные преимущества и недостатки описываемых методов. Предназначено для студентов старших курсов и аспирантов, изучающих методы искусственного интеллекта, машинное обучение и интеллектуальные робототехнические системы.

Издательство:
МФТИ
Год издания:
2019
Количество страниц:
52

Полный текст книги доступен студентам и сотрудникам МФТИ через Личный кабинет https://profile.mipt.ru/services/.

После авторизации пройдите по ссылке «Books.mipt.ru Электронная библиотека МФТИ»