Введение в методы машинного обучения с подкреплением: учебное пособие
Панов А. И.
Рассмотрены основные понятия и алгоритмы машинного обучения с подкреплением – активно развивающегося направления в искусственном интеллекте. На основе материалов лекций, читаемых автором в МФТИ и Высшей школе экономики, представлены основные методы обучения с подкреплением: методы динамического программирования, метод временных различий, градиентные и иерархические методы. Особое внимание уделено рассмотрению алгоритмических аспектов указанных подходов, приводятся иллюстративные примеры и отмечаются основные преимущества и недостатки описываемых методов. Предназначено для студентов старших курсов и аспирантов, изучающих методы искусственного интеллекта, машинное обучение и интеллектуальные робототехнические системы.
- Издательство:
- МФТИ
- Год издания:
- 2019
- Количество страниц:
- 52
Вы находитесь на официальном сайте библиотеки МФТИ, здесь представлен каталог электронных книг, доступных для скачивания и чтения студентам и сотрудникам МФТИ, а также посетителям сайта, находящимся в локальной сети МФТИ.
Для доступа к полным текстам необходимо пройти авторизацию на портале https://profile.mipt.ru, после чего вернуться на сайт библиотеки https://books.mipt.ru.
В случае возникновения затруднений при выполнении указанных действий, пожалуйста, свяжитесь с нами.
Если Вы считаете нужным сообщить об опечатке, ошибке или о другой проблеме, Вы можете это сделать.