Нейросети оказались внимательнее людей
Однако это не повод считать их умнее нас: невнимательность представителей нашего вида оказалась важным средством концентрации на зрительных целях, которого у нейросетей нет.
Учёные из Калифорнийского университета в Санта-Барбаре обнаружили одно интересное отличие принципов работы нейросетей с глубинным обучением от мозга человека. Нейросети замечают нетипично крупные объекты в поле зрения, в то время как люди периодически упускают их. Тем не менее, говорят авторы работы, это полезное свойство нашего восприятия, а не его недостаток. Соответствующая статья опубликована в журнале Current Biology.
Фото: © Скриншот из видео YouTube/selective attention test
Нейросети для визуального поиска (Faster R-CNN, R-FCN и YOLO) и люди (60 здоровых добровольцев) должны были выполнить одинаковое задание — указать местоположение конкретного предмета на картинке. В эксперименте использовали 42 различных фона, при этом объекты поиска на каждом фоне отличались. Иногда предмет находился в неожиданном месте, а иногда он имел необычный (чаще всего — гигантский) размер. Например, в изображении ванной комнаты требовалось выделить зубную щётку. Она могла лежать на коврике, а могла находиться на раковине, но при этом быть в пять раз больше нормы.
И люди, и нейросети достаточно легко справлялись с задачей найти предмет в нетипичном месте. Время поиска при этом почти не увеличивалось. Интересно то, что на огромную зубную щётку на раковине участники эксперимента чаще всего не реагировали, хотя точно видели. О последнем говорят траектории перемещения их глазных яблок. Восприятие нейросетей было лишено такого недостатка: они обнаруживали необычно крупные предметы с такой же скоростью, как и целевые объекты стандартного размера.
Компьютерное зрение считается одной из самых сложных областей применения искусственного интеллекта. В ней машины всё ещё значительно проигрывают людям и другим животным. Поэтому тот факт, что нейронные сети показали себя более внимательными при поиске объектов, на первый взгляд кажется существенным продвижением технологий распознавания образов. Однако авторы интерпретируют это иначе.
По словам учёных, способность людей игнорировать предметы слишком большого размера, не соответствующего их ожиданиям, помогает им концентрироваться на важном и снижает число "ложных срабатываний" зрительной системы. У нейросетей при поиске конкретных объектов ошибки такого рода случаются чаще. Поэтому в алгоритмы для визуального поиска ещё только предстоит встроить фильтр целевых объектов по размеру. По возможности механизм такой фильтрации позаимствуют у зрительной системы человека.