Искусственный интеллект распознает изображения хуже человека
У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Результаты исследования опубликованы в сборнике Proceedings of Seventh International Congress on Information and Communication Technology.
Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.
Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.
Владимир Винников
«Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — комментирует автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. — Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры».
Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.
В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.
Нейросетевые системы распознавания образов сегодня активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.
Ученые полагают, что недостатки машинного распознавания образов можно исправить.
Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.
«Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах», — полагает Владимир Винников.
Вам также может быть интересно:
Перспективы ИИ: математика машинного обучения в фокусе
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ провел выездной воркшоп «Математика машинного обучения». Здесь собрались ведущие ученые и специалисты НИУ ВШЭ в области машинного обучения, математики и статистики. В центре внимания исследователей оказались математические аспекты, лежащие в основе современных и наиболее перспективных направлений машинного обучения. Программа воркшопа включала мини-курсы, практические работы, доклады и круглый стол, посвященный перспективам развития ИИ в России.
Внедрение искусственного интеллекта в организации: какие эффекты отмечают сотрудники
45% организаций, которые занимались внедрением ИИ в работу, заявили о повышении производительности труда в результате его использования. Об этом говорится в исследовании «Внедрение ИИ в работу организаций: чем обусловлена вариация эффектов на труд?». Исследование проведено директором Центра статистики труда и заработной платы ИСИЭЗ НИУ ВШЭ Анной Демьяновой и стажером-исследователем центра Дарьей Талакаускас. Оно было презентовано на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества (XXV ЯМНК), проходящей в НИУ ВШЭ с 15 по 18 апреля.
«Идею всегда задает человек»: что дает ИИ образованию и медиа
ИИ-технологии меняют принципы работы образования и медиаиндустрии. Большинство студентов уже в той или иной мере используют ИИ, а нейросети уже массово производят все виды контента. Возможности и вызовы эксперты обсудили на конференции «Образование и медиа в эпоху цифровых перемен», организованной Дирекцией по маркетинговым коммуникациям НИУ ВШЭ и «Яндекс Образованием».
В Вышке стартовали открытые семинары «ИИ в индустрии»
Институт искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ запустил цикл открытых семинаров. Встречи посвящены актуальным вопросам внедрения искусственного интеллекта в различные отрасли экономики. Семинары проводятся еженедельно в 18:00 в кампусе на Покровском бульваре. Для участников также предусмотрена онлайн-трансляция.
Ученые представили новый метод для работы с несбалансированными данными
Специалисты факультета компьютерных наук НИУ ВШЭ и Лаборатории искусственного интеллекта Сбера разработали геометрический метод расширения данных — Simplicial SMOTE. Тесты на разных наборах данных показали, что он значительно улучшает качество работы AI. Метод особенно полезен в ситуациях, когда редкие случаи очень важны, например в борьбе с мошенничеством или при диагностике редких болезней. Результаты исследования доступны в открытом архиве Arxiv.org и будут представлены на Международной конференции по обнаружению знаний и анализу данных (KDD) летом 2025 года в Торонто.
В Вышке рассчитали экономический эффект от внедрения технологий ИИ в России
Институт статистических исследований и экономики знаний НИУ ВШЭ оценил потенциальный экономический эффект от внедрения и использования технологий искусственного интеллекта в отраслях российской экономики до 2035 года. Эксперты также предположили, каким должен быть объем ресурсов, которые потребуются организациям для освоения данного класса технологий.
Мегасайенс, ИИ и суперкомпьютеры: Вышка расширяет сотрудничество с ОИЯИ
Специалисты по компьютерным технологиям НИУ ВШЭ и Объединенного института ядерных исследований (ОИЯИ) обсудили сотрудничество и совместные проекты на встрече в Лаборатории информационных технологий им. М.Г. Мещерякова (ЛИТ). Со стороны ВШЭ в дискуссии участвовали заведующий Лабораторией вычислительной физики МИЭМ Лев Щур и сотрудники Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук Денис Деркач и Федор Ратников.
Искусственный интеллект предсказал поведение квантовых систем
Ученые ВШЭ совместно с коллегами из Университета Южной Калифорнии разработали алгоритм, который быстро и точно предсказывает поведение квантовых систем — от квантовых компьютеров до солнечных батарей. С его помощью удалось смоделировать процессы в полупроводнике MoS₂ и выяснить, что на движение заряженных частиц влияет не только количество дефектов, но и их расположение. Эти дефекты могут замедлять или ускорять перенос заряда, создавая эффекты, которые раньше было сложно учесть при применении стандартных методов. Исследование опубликовано в журнале The Proceedings of the National Academy of Sciences (PNAS).
Вышка запускает курс повышения квалификации по ИИ в образовании
Факультет компьютерных наук НИУ ВШЭ запускает курс повышения квалификации по искусственному интеллекту в образовании. Программа предназначена для педагогов, преподавателей, методистов, планирующих интегрировать технологии ИИ в учебный процесс, а также для управленческих команд образовательных учреждений, заинтересованных в улучшении образовательных процессов через внедрение ИИ.
«Многие хотят создавать продукты на базе ИИ и стать конкурентоспособнее»
В 2024 году на магистерскую онлайн-программу «Искусственный интеллект», реализуемую факультетом компьютерных наук ВШЭ, поступило рекордное количество первокурсников — более 300. Откуда такой высокий интерес к ИИ, как строится обучение и какими новыми компетенциями будут обладать выпускники программы, рассказала ее академический руководитель Елена Кантонистова.