Чтобы увидеть грань между лучшим искусственным интеллектом и умственными способностями семилетнего ребенка, загляните в популярную видеоигру Minecraft http://minecraft-files.ru/. Молодой человек может научиться находить редкий бриллиант в игре после просмотра 10-минутной демонстрации на YouTube. Искусственный интеллект (ИИ) нигде не близко. Но в уникальном компьютерном конкурсе, завершающемся в этом месяце, исследователи надеются сократить разрыв между машиной и ребенком — и тем самым помочь уменьшить вычислительную мощность, необходимую для обучения ИИ.
Конкуренты могут занять до четырех дней и использовать не более восьми миллионов шагов, чтобы обучить своих ИИ найти бриллиант. Это все еще намного дольше, чем потребовалось бы ребенку, но гораздо быстрее, чем типичные модели искусственного интеллекта в наши дни.
Конкурс призван стимулировать прогресс в подходе, называемом имитационным обучением. Это контрастирует с популярной техникой, известной как обучение с подкреплением, в которой программы пробуют тысячи или миллионы случайных действий методом проб и ошибок, чтобы найти лучший процесс. Усиленное обучение помогло выработать рекомендации для пользователей Netflix, создало способы обучения роботизированному оружию на фабриках и даже превзошло людей в играх. Но это может потребовать много времени и вычислительной мощности. Попытки использовать усиленное обучение для создания алгоритмов, которые могут безопасно управлять автомобилем или побеждать в сложных играх, таких как Go, вовлекали сотни или тысячи компьютеров, работающих параллельно, чтобы совместно управлять сотнями лет симуляций — то, что только самые глубоко урезанные правительства и корпорации могут себе позволить.
Имитационное обучение может повысить эффективность процесса обучения, имитируя то, как люди или даже другие алгоритмы ИИ решают задачу. А событие кодирования, известное как Конкурс MineRL (произносится как «минерал»), побуждает участников использовать эту технику, чтобы научить ИИ играть в игру.
По словам Уильяма Гусса, кандидата наук по теории глубокого обучения в Университете Карнеги-Меллона в Питтсбурге, штат Пенсильвания, и руководителя организационной команды Конкурса MineRL, методы обучения усилению не имели бы шансов на этом конкурсе сами по себе. Работая наугад, ИИ может преуспеть только в том, чтобы срубить дерево или два в пределе восьми миллионов шагов соревнования — и это только одна из предпосылок для создания железной кирки для добычи алмазов в игре. «Разведка очень, очень сложная», — говорит Гусс. «Имитационное обучение дает вам хорошее представление о вашей среде».