Российские учёные из Института искусственного интеллекта AIRI разработали универсальную систему машинного зрения для трёхмерного распознавания объектов, которая одинаково хорошо справляется с разными наборами тестов. Разработка может применяться в робототехнике, дополненной реальности и 3D-сканировании.
Ранее требовалось создавать отдельные модели для каждого набора данных, что замедляло процесс разработки. Новая система, основанная на чистом трансформере-кодировщике, упрощает и ускоряет этот процесс.
Создание систем трёхмерного машинного зрения ограничено небольшими и разнородными наборами данных. Самый большой набор данных содержит всего около 7 тыс. сцен, что в несколько раз меньше, чем миллионы изображений для генеративных моделей.
Для решения проблемы российские учёные создали универсальную нейросеть на базе трансформера-кодировщика без оптимизаций под конкретные наборы данных и провели масштабную переразметку для сокращения числа классов объектов.
Эксперименты показали, что новая модель эффективно работает с большим числом разнородных наборов данных и распознаёт объекты в разных типах «облаков точек» с лазерных радаров и трёхмерных сканеров. Учёные надеются, что разработка ускорит создание систем трёхмерного зрения и повысит качество их работы.
Алиханову показали первый российский трактор-робот с ИИ от Cognitive Pilot
Российские ученые разработали нейроморфное устройство для поиска углеводородов