Российские учёные из Института искусственного интеллекта AIRI разработали универсальную систему машинного зрения для трёхмерного распознавания объектов, которая одинаково хорошо справляется с разными наборами тестов. Разработка может применяться в робототехнике, дополненной реальности и 3D-сканировании.

Ранее требовалось создавать отдельные модели для каждого набора данных, что замедляло процесс разработки. Новая система, основанная на чистом трансформере-кодировщике, упрощает и ускоряет этот процесс.

Создание систем трёхмерного машинного зрения ограничено небольшими и разнородными наборами данных. Самый большой набор данных содержит всего около 7 тыс. сцен, что в несколько раз меньше, чем миллионы изображений для генеративных моделей.

Для решения проблемы российские учёные создали универсальную нейросеть на базе трансформера-кодировщика без оптимизаций под конкретные наборы данных и провели масштабную переразметку для сокращения числа классов объектов.

Эксперименты показали, что новая модель эффективно работает с большим числом разнородных наборов данных и распознаёт объекты в разных типах «облаков точек» с лазерных радаров и трёхмерных сканеров. Учёные надеются, что разработка ускорит создание систем трёхмерного зрения и повысит качество их работы.

Читайте еще по теме:

Российские инженеры разработали «техническое зрение» для речных и морских судов (и водных беспилотников тоже)

Алиханову показали первый российский трактор-робот с ИИ от Cognitive Pilot

Российские ученые разработали нейроморфное устройство для поиска углеводородов

Источники
ИА «ТАСС»
Комментировать

Сейчас на главной