Введение в методы машинного обучения с подкреплением: учебное пособие
Панов А. И.

Рассмотрены основные понятия и алгоритмы машинного обучения с подкреплением – активно развивающегося направления в искусственном интеллекте. На основе материалов лекций, читаемых автором в МФТИ и Высшей школе экономики, представлены основные методы обучения с подкреплением: методы динамического программирования, метод временных различий, градиентные и иерархические методы. Особое внимание уделено рассмотрению алгоритмических аспектов указанных подходов, приводятся иллюстративные примеры и отмечаются основные преимущества и недостатки описываемых методов. Предназначено для студентов старших курсов и аспирантов, изучающих методы искусственного интеллекта, машинное обучение и интеллектуальные робототехнические системы.

Издательство:
МФТИ
Год издания:
2019
Количество страниц:
52
Нельзя скачать PDF (17.6 MB)
Вы находитесь на официальном сайте библиотеки МФТИ, здесь представлен каталог электронных книг, доступных для скачивания и чтения студентам и сотрудникам МФТИ, а также посетителям сайта, находящимся в локальной сети МФТИ. Для доступа к полным текстам необходимо пройти авторизацию на портале https://profile.mipt.ru, после чего вернуться на сайт библиотеки https://books.mipt.ru. В случае возникновения затруднений при выполнении указанных действий, пожалуйста, свяжитесь с нами.
Если Вы считаете нужным сообщить об опечатке, ошибке или о другой проблеме, Вы можете это сделать.