В рамках проекта VizDoom развивается система искусственного интеллекта для игры в Doom. От обычных игровых ботов VizDoom отличается тем, что система работает на основе анализа визуальной информации, отслеживая только изменение содержимого экрана и используя методы машинного обучения для определения стратегии игры. Код проекта распространяется под лицензией MIT. Проект развивается группой исследователей из Технологического университета города Познань (Польша).

Несколько дней назад состоялось соревнование Visual Doom AI Competition между ботами, в котором приняли участие команды из лабораторий по исследованию искусственного интеллекта различных университетов, а также компаний Intel и Facebook. В состязании Limited Deatchmatch первое место занял бот команды из Facebook, на втором месте бот Университета Карнеги — Меллон, на третьем – бот команды Эссекского университета. В состязании Full Deatchmatch первое место заняла команда Intel, второе – Университета Карнеги — Меллон (CMU), третье – Университета Восточной Финляндии. На соревнованиях также проводились показательные бои между людьми и ботами, в которых боты одержали победу. Платформой поддерживается как прохождение игры в однопользовательском режиме, так и участие в командных состязаниях.

Ключевой задачей проекта является изучение возможностей по применению методов машинного обучения на основе восприятия визуальной информации. Для распознавания изображений в VizDoom используется свёрточная нейронная сеть, моделирующая особенности зрительной коры. VizDoom оформлен в виде платформы, позволяющей создавать ботов на языках Python, C++, Java. Предоставляется API для полного контроля за работой бота, в том числе для применения различных методов машинного обучения. Например, в варианте бота от разработчиков из Университета Карнеги — Меллон была использована модифицированная глубинная нейронная сеть с подкреплением (DQN, Deep Q-network), основанная на наработках компании DeepMind. Для увеличения качества отслеживания перемещения врагов и прогнозирования выстрелов в нейронной сети применялась архитектура LSTM.