Нейросеть научили управлять игрой футбольной команды [ Редагувати ]

Специалисты из США создали алгоритм, способный анализировать коллективное поведение игроков и стратегию в командных видах спорта, например, футболе.
Программа обучалась на траекториях профессиональных футболистов в матчах команд из лиги УЕФА и при этом сама определяла роли игроков по ходу игры, не привязываясь к их формальным позициям в составе команде.
В новой работе авторы предложили гибридную схему машинного обучения, которая сочетает две глубоких нейросети. Одна занималась тем, что анализировала действия игроков в зависимости от игрового контекста движений мяча и игроков соперника, стараясь предсказать наилучший план действий каждого игрока в отдельной игровой ситуации.
Эта система обучалась с подкреплением, то есть на каждое действие система получает определенный отклик от "среды". Например, если какая-то серия действий приводила к пропущенному мячу, нейросеть была оштрафована, а если виртуальные игроки забивали гол сопернику - награждена.
При этом вторая нейросеть обучалась без учителя, то есть работала с данными без меток, стараясь каким-то образом разбить игроков на несколько ролей.
Играть в футбол системы учились по записям 45 профессиональных матчей Европейской Лиги УЕФА. На этом этапе потребовалась еще одна нейросеть - реккурентная, - она выражала последовательность действий виртуальных игроков.
В этом эксперименте также оказалось, что новая система работала значительно эффективнее предыдущих подходов, так называемого "имитационного" обучения. Однако в случае длинных розыгрышей точность работы алгоритма ухудшалась, так как игровые события развивались, как снежный ком, и предсказать их было сложнее.
Тем временем целебные свойства стакана водки раскрыли британские ученые.