Компьютерная модель нейросети, созданная специалистами китайской интернет-компании Alibaba Group, впервые превзошла человека при прохождении теста на понимание прочитанного.
Нейронная сеть от Alibaba набрала в тестах Стэнфорда на чтение и понимание 82,44 балла, превзойдя средний результат людей, принявших участие в том же испытании, — 82,34. Сравнительные тесты были пройдены 11 января, а днем позже другая нейронная сеть, от Microsoft, также успешно сдала тесты Стэнфорда, набрав 82,65 балла.
Опросник Стэнфордского университета Stanford Question Answering Dataset (SQuAD) — один из самых сложных испытаний в области когнитивной обработки текстов. SQuAD — информационный массив, включающий более ста тысяч пар вопросов и ответов, базирующихся более чем на 500 статьях из "Википедии".
В тесты входили упражнение на чтение или прослушивание определенной информации, а затем ответы на проверочные вопросы. Например, текст об истории британского сериала "Доктор Кто" и вопросы о том, как назывался космический корабль главного героя. Ранее компании Facebook, Tencent и Samsung также предоставляли свои нейронные сети для прохождения тестов Стэнфорда, однако ИИ от Alibaba впервые превзошел результаты человека.
Представители принадлежащего компании Института технологий и искусственного интеллекта (iDST) назвали результат "исторической вехой".
"Тесты такого рода — это определенно полезные показатели того, как далеко может зайти работа над искусственным интеллектом. Однако реальная польза от ИИ получается тогда, когда он действует в гармонии с людьми", — прокомментировал представитель Microsoft Эндрю Пикап.
Ло Сы, главный специалист Alibaba Group по автоматической обработке текстов, написанных на естественных языках, счел это достижение "большой честью", но заметил, что оно, вероятно, приведет к замене многих сотрудников на компьютеры. Технологии "можно будет постепенно адаптировать к практическому применению, в частности использовать при обслуживании потребителей, в путеводителях по музеям и для того, чтобы онлайн отвечать на медицинские обращения пациентов, что очень сильно снизит потребность в участии людей", добавил ученый.