Во вторник корпорация Microsoft представила бета-версию своей Open Source-системы Cognitive Toolkit, предназначенной для распознавания речи и изображений.

На прошлой неделе подразделение Microsoft, специализирующееся на работе с искусственным интеллектом (Microsoft Artificial Intelligence and Research), сообщило о прорыве в распознавании речи: её система для транскрипции человеческой речи допускает всего 5,9 % ошибок при распознавании разговорной речи. Это стало возможным благодаря применению наработок из Open Source-проекта Computational Network Toolkit (CNTK), бета-версия которого была выпущена на днях под новым названием — Cognitive Toolkit. Изначально созданный для распознавания речи проект уже заметно вырос в своём применении, и сегодня Microsoft описывает Cognitive Toolkit как «систему для глубокого обучения (deep learning), используемую для ускорения развития таких областей, как распознавание речи и изображений, релевантности поиска на обычных компьютерных процессорах и графических процессорах NVIDIA».

«Мы сделали из исследовательского инструмента нечто, что работает в промышленном окружении», — заявил Фрэнк Сейд (Frank Seide), главный исследователь в Microsoft Artificial Intelligence and Research и ключевой архитектор продукта Microsoft Cognitive Toolkit. В последней версии утилит была улучшена производительность (особенно при работе с большими объёмами данных, распределённых по разным компьютерам) и появилась поддержка машинного обучения, называемого reinforcement learning — обучения с подкреплением (агент обучается, взаимодействуя с некоторой средой).

Набор утилит Microsoft Cognitive Toolkit опубликован на GitHub под свободной лицензией MIT и доступен для использования на языках программирования Python и C++.

Источник: http://www.nixp.ru/