Введение в методы машинного обучения с подкреплением: учебное пособие
Панов А. И.
Рассмотрены основные понятия и алгоритмы машинного обучения с подкреплением – активно развивающегося направления в искусственном интеллекте. На основе материалов лекций, читаемых автором в МФТИ и Высшей школе экономики, представлены основные методы обучения с подкреплением: методы динамического программирования, метод временных различий, градиентные и иерархические методы. Особое внимание уделено рассмотрению алгоритмических аспектов указанных подходов, приводятся иллюстративные примеры и отмечаются основные преимущества и недостатки описываемых методов. Предназначено для студентов старших курсов и аспирантов, изучающих методы искусственного интеллекта, машинное обучение и интеллектуальные робототехнические системы.
- Издательство:
- МФТИ
- Год издания:
- 2019
- Количество страниц:
- 52
Полный текст книги доступен студентам и сотрудникам МФТИ через Личный кабинет https://profile.mipt.ru/services/.
После авторизации пройдите по ссылке «Books.mipt.ru Электронная библиотека МФТИ»