Система, разработанная специалистами из компании OpenAI, научилась выполнять непростую задачу — собирать кубик Рубика при помощи одной роботизированной руки (использовалась роборука разработки Shadow Robot Company). ИИ-система, как указывается, обучалась методом проб и ошибок; по словам Петера Велиндера (Peter Welinder), одного из участников команды разработчиков, вначале система не знала ничего о том, как двигать рукой или как будет реагировать кубик Рубика.
При успешно выполненной манипуляции с головоломкой система зарабатывала очки — и была запрограммирована так, чтобы их максимизировать. Сначала система тренировалась в симуляции, а затем перешла к тестам с реальным кубиком Рубика.
Отмечается, что ИИ не должен был понять, как решить головоломку. Визуальные датчики и специальный алгоритм для решения давали ему инструкции о необходимых движениях, так что ИИ концентрировался именно на необходимых движениях (и учился в том числе исправлять ошибки).
Discussion about this post