Поиск по публикациям и новостям

Российские инженеры-программисты научили роборуку «думать» ИИ
Она уже может различить и сортировать предметы по цвету в нужной локации

Ученые МФТИ, Института искусственного интеллекта AIRI и Федерального исследовательского центра «Информатика и управление» РАН разработали метод управления роботизированной системой, которая выполняет свои действия, опираясь на текстовые инструкции и визуальную информацию.

Роборука научилась распределять кубики на столе по цветам и распределять их в заданную область
Роборука научилась распределять кубики на столе по цветам и распределять их в заданную область

Дальнейшее развитие этой методики позволит создавать роботов для автономного выполнения сложных многоходовых операций без участия человека. Пока в мировой практике этого не удалось никому, однако над прототипами таких роботов работают и в России, и в других странах мира.

Как отмечают в пресс-службе МФТИ, в основе методики лежит архитектура бимодального трансформера. Она уже изначально была обучена ряду навыков: переводу текста, получению ответов на вопросы по изображению, генерации изображений и  ряду других.

Когда для управления роботом была добавлена новая модальность, роботизированная система получила возможность ориентироваться в незнакомой обстановке и самостоятельно определять алгоритм действий для решения поставленной задачи. Научная работа с описанием метода была опубликована в международном журнале IEEE Access.

В МФТИ отмечают, что моделью в научной работе стала роборука с шестью степенями свободы. Она должна была выполнить сортировку объектов на столе по цветам и сборку их в заданной области. Выбор действия роборукой происходил на основе текстовой инструкции и данных с видеокамер.

Видео: пресс-служба МФТИ

По данным разработчиков, принцип работы алгоритма обучения манипулятора «напоминает модель GPT», но разработанная модель вместо текста при этом выдает последовательность действий для робота. После каждого действия электронно-вычислительное устройство, которое управляет роборукой, получает обратную связь с видеокамер и потом планирует новое действие.

Новизна работы в том, что для обучения робота мы использовали готовые языковые модели - алгоритмы, которые помогают переводить естественную речь в код, понятный системе управления. Она представляют собой нейронные сети, которые предобучены на больших объемах текстовых данных. В нашем случае была применена мультимодальная модель RozumFormer. В отличие от других, она может генерировать ответ и на текстовые запросы, и на те, которые сделаны в виде изображений.
Соавтор работы, младший научный сотрудник ФИЦ «Информатика и управление» РАН и научный сотрудник AIRI Алексей Ковалев

RozumFormer дообучили так, чтобы она стала «понимать» цвета кубиков, расстояния до них и другие параметры окружающей действительности, и она начала управлять манипулятором. Пошаговая адаптация подготовила нейросеть к тому, чтобы она, получая обратную связь с видеокамер, смогла на основе усвоенных алгоритмов самостоятельно планировать дальнейшие действия и решать поставленные перед ней задачи. И у нее получилось.

Теперь перед учеными стоит задача обучить модель запоминать цепочки более длинных действий. Впоследствии в перспективе это поможет роботам без человека справиться с действиями, где нужны нестандартный для робототехнической системы подход и мгновенная оценка ситуации. Например, в самом простом варианте для робота-помощника это мытье посуды, уборка и сортировка предметов по комнатам и по назначению во время уборки.

Источники
МФТИ IEEE Access

Сейчас на главной

34 минуты назад
Калужские заводы наращивают производство автомобилей

Предприятия АГР и «Автомобильные технологии» планируют выпустить более 137 тысяч машин до конца года

4 часа назад
Стало известно, есть ли у России оружие мощнее «Орешника»: разработку держат в строжайшем секрете

Новая баллистическая ракета получит увеличенный радиус действия

4 часа назад
Беспилотный колесный робот-трактор с гибридным приводом разработали в России: появились первые кадры

Грузоподъемность машины — до 3,2 тонны

5 часов назад
Новейший истребитель Су-57 получил две боковые антенны, дополняющие РЛК переднего обзора

Пропускная способность РЛК Н036 «Белка» — 62 одновременно сопровождаемые цели

5 часов назад
В России соберут три вертолета «Ансат» с отечественными двигателями ВК-650В до конца 2025 года

Взлетная масса винтокрылой машины — до 3,6 тонны

6 часов назад
Россия получит 270 самолетов МС-21 и 142 SSJ New до 2030 года: программу развития авиапрома обновят

Также кабмин пересмотрит подход к поддержке транспортных и промышленных предприятий

7 часов назад
ОДК впервые показала сварку деталей авиадвигателей технологией трения: уникальные кадры

Такой метод позволяет снизить массу и увеличить ресурс силовых установок

17 апр. 2025 г., 21:38:31
Российские учёные на шаг ближе к идеальному заменителю крови благодаря свойствам полоксамера 188

Исследования полимера улучшат качество заменителей крови, что повысит их эффективность

17 апр. 2025 г., 21:23:33
Ростех пообещал сертифицировать самолет «Суперджет» SJ-100 с ПД-8 осенью 2025 года: сдвига сроков вправо не будет

Информация о переносе сертификации на 2026 год не соответствует действительности

17 апр. 2025 г., 20:16:11
Создание коллайдера нового поколения ВЭПП-6 не за горами: отечественный сверхпроводящий магнит способен изменить ход исследования

Магнит учёных из Новосибирска улучшит светимость пучка на электрон-позитронном коллайдере

17 апр. 2025 г., 18:20:37
2ГИС представил 3D-модели общественного транспорта в России: они двигаются по карте

Реалистичные модели автобусов и трамваев доступны в режиме реального времени

17 апр. 2025 г., 18:12:22
Россияне не боятся угрозы ИИ для карьеры

Среди опрошенных 63% профессионалов уверены, что сохранят свои рабочие места после внедрения ИИ