Выберите язык: Ru / En
0
2013
Impact Factor

    Кошманова Наталья Павловна

    125047, Россия, г. Москва, Миусская пл., д. 4
    koshmanova.n@gmail.com
    Институт прикладной математики им. Келдыша РАН

    Публикации:

    Кошманова  Н. П., Павловский В. Е., Tрифонов  Д. С.
    Подробнее
    Рассматривается метод построения системы управления роботом-манипулятором с использованием обучения с подкреплением. Система управления будет строиться с помощью обучающегося алгоритма, где информацией для обучения будут совершаемые действия и «награда», — величина, характеризующая качество работы системы управления. Целью обучения является построение алгоритма управления, максимизирующего суммарную награду за некоторый промежуток времени. Алгоритм обучения и построенная в результате его работы система управления протестированы для задачи уклонения манипулятора от летящего в него предмета.
    Ключевые слова: обучение с подкреплением, манипулятор, управление
    Цитирование: Кошманова  Н. П., Павловский В. Е., Tрифонов  Д. С.,  Управление манипулятором с помощью обучения с подкреплением, Нелинейная динамика, 2012, т. 8, № 4, с.  689-704
    DOI:10.20537/nd1204002

    Вернуться к списку