Сегодня IBM объявила о выпуске крупнейшего в мире набора данных об атрибутах лиц, чтобы бороться с предвзятостью в системах искусственного интеллекта, используемых для распознавания человеческих лиц. Набор данных был создан учеными IBM и содержит один миллион изображений, что в пять раз превышает количество изображений в текущем крупнейшем наборе данных атрибутов лица. Он станет общедоступным этой осенью.

Хотя ИИ спровоцировал множество технологических прорывов, общественность выразила обеспокоенность по поводу предвзятости, особенно в задачах, связанных с расой. Исследование, проведенное учеными из Массачусетского технологического института и Microsoft в начале этого года, показало, что, хотя технология распознавания лиц Microsoft, IBM и Megavii замечательно справляется с распознаванием светлокожих мужчин (средняя точность 99,6%), ей сложно правильно распознавать темнокожих женщин. Система IBM достигла точности только 65,3%.

Сегодняшние эффективные системы искусственного интеллекта обучаются на крупномасштабных аннотированных наборах данных, и считается, что отсутствие разнообразия расы и цвета кожи в наборах данных изображений лиц может способствовать предвзятости в приложениях / продуктах искусственного интеллекта.

Новый набор данных IBM разработан с учетом отсутствия разнообразия. Набор данных также может сопоставлять атрибуты (цвет волос, растительность на лице и т. Д.) С личностью человека, а возможность перекрестных ссылок недоступна в текущих наборах данных.

IBM также выпустит набор оценочных данных, который включает 36 000 изображений лиц, равномерно распределенных среди всех этнических групп, полов и возрастов.

Другие технологические гиганты с научно-исследовательскими институтами мирового уровня также стремятся уменьшить междемографические различия в точности своих продуктов. Вчера Microsoft объявила об усовершенствовании своих методов распознавания лиц, которое снижает количество ошибок до 20 раз для мужчин и женщин с более темной кожей и в 9 раз для всех женщин.

В сентябре этого года IBM проведет конкурс моделей распознавания лиц, используя свой новый набор данных изображений лиц. Результаты будут объявлены на техническом семинаре, организованном IBM и Мэрилендским университетом на Европейской конференции по компьютерному зрению (ECCV) в этом году 14 сентября.

Журналист: Тони Пэн | Редактор: Майкл Саразен

Подпишитесь на нас в Twitter @Synced_Global, чтобы узнавать больше об искусственном интеллекте!

Подпишитесь на Synced Global AI Weekly, чтобы получать информативные технические новости, обзоры и анализ! Нажмите здесь!