Поиск по публикациям и новостям

Российские инженеры-программисты научили роборуку «думать» ИИ
Она уже может различить и сортировать предметы по цвету в нужной локации

Ученые МФТИ, Института искусственного интеллекта AIRI и Федерального исследовательского центра «Информатика и управление» РАН разработали метод управления роботизированной системой, которая выполняет свои действия, опираясь на текстовые инструкции и визуальную информацию.

Роборука научилась распределять кубики на столе по цветам и распределять их в заданную область

Дальнейшее развитие этой методики позволит создавать роботов для автономного выполнения сложных многоходовых операций без участия человека. Пока в мировой практике этого не удалось никому, однако над прототипами таких роботов работают и в России, и в других странах мира.

Как отмечают в пресс-службе МФТИ, в основе методики лежит архитектура бимодального трансформера. Она уже изначально была обучена ряду навыков: переводу текста, получению ответов на вопросы по изображению, генерации изображений и  ряду других.

Когда для управления роботом была добавлена новая модальность, роботизированная система получила возможность ориентироваться в незнакомой обстановке и самостоятельно определять алгоритм действий для решения поставленной задачи. Научная работа с описанием метода была опубликована в международном журнале IEEE Access.

В МФТИ отмечают, что моделью в научной работе стала роборука с шестью степенями свободы. Она должна была выполнить сортировку объектов на столе по цветам и сборку их в заданной области. Выбор действия роборукой происходил на основе текстовой инструкции и данных с видеокамер.

Видео: пресс-служба МФТИ

По данным разработчиков, принцип работы алгоритма обучения манипулятора «напоминает модель GPT», но разработанная модель вместо текста при этом выдает последовательность действий для робота. После каждого действия электронно-вычислительное устройство, которое управляет роборукой, получает обратную связь с видеокамер и потом планирует новое действие.

Новизна работы в том, что для обучения робота мы использовали готовые языковые модели - алгоритмы, которые помогают переводить естественную речь в код, понятный системе управления. Она представляют собой нейронные сети, которые предобучены на больших объемах текстовых данных. В нашем случае была применена мультимодальная модель RozumFormer. В отличие от других, она может генерировать ответ и на текстовые запросы, и на те, которые сделаны в виде изображений.
Соавтор работы, младший научный сотрудник ФИЦ «Информатика и управление» РАН и научный сотрудник AIRI Алексей Ковалев

RozumFormer дообучили так, чтобы она стала «понимать» цвета кубиков, расстояния до них и другие параметры окружающей действительности, и она начала управлять манипулятором. Пошаговая адаптация подготовила нейросеть к тому, чтобы она, получая обратную связь с видеокамер, смогла на основе усвоенных алгоритмов самостоятельно планировать дальнейшие действия и решать поставленные перед ней задачи. И у нее получилось.

Теперь перед учеными стоит задача обучить модель запоминать цепочки более длинных действий. Впоследствии в перспективе это поможет роботам без человека справиться с действиями, где нужны нестандартный для робототехнической системы подход и мгновенная оценка ситуации. Например, в самом простом варианте для робота-помощника это мытье посуды, уборка и сортировка предметов по комнатам и по назначению во время уборки.

Источники
МФТИ IEEE Access

Сейчас на главной

2 минуты назад
До старта серийного производства осталось пять дней: на каждой Lada Iskra находят по 50–70 дефектов

Примерно половину недоработок простой обыватель даже не заметит

12 минут назад
Компания «Камгазблок» запустила новую линию производства газобетонных блоков на Камчатке

Продукция обеспечит материалами строительную отрасль

43 минуты назад
Секреты орбитальной станции РОС: Россия готовится стать лидером в космической гонке

В отличие от Международной космической станции РОС сможет функционировать автоматически

1 час назад
Каждый третий россиянин мечтает о роботе-помощнике с ИИ

Часть опрошенных готовы доверить роботам заботу о своих детях

1 час назад
AR-революция в логистике: учёные Smart Engines разработали технологию для автоматической проверки грузовых контейнеров с помощью умных очков

Новый промышленный инструмент избавляет от необходимости ручной проверки номеров и защитных пломб на контейнерах

2 часа назад
Мошенники обманывают россиян в Telegram, предлагая брендовые вещи с маркетплейса из Поднебесной

Злоумышленники обещают жертве выкуп одежды знаменитых марок по низкой цене

3 часа назад
Летает на расстояние до 300 км: беспилотники самолетного типа «Кутх» разработали на Чукотке

Скорость БПЛА — до 80 км/ч

3 часа назад
Эффективный торфяной поглотитель нефтепродуктов создали в МЭИ

Нефтемкость торфяных таблеток увеличили в два раза

4 часа назад
С конвейера ТМХ сошел 50-й электропоезд постоянного тока — ЭП2ДМ

Состав оснащен эргономичными креслами, кондиционером и удобствами для людей с ограниченной мобильностью

4 часа назад
Российский морской разведчик «Виктор Леонов» внезапно появился у берегов Ирландии

Корабль проекта 864 оснащен датчиками для перехвата электромагнитных сигналов

4 часа назад
Ретро-автомобиль с клыками: 45-летнюю «Волгу» за 1 млн рублей выставили на продажу в России

На модели ГАЗ-24 в основном ездили партийные руководители разных рангов

4 часа назад
С дополнительным набором опций: «Колнаг» выпустил культиватор-гребнеобразователь — «Иксион»

Машину оснастили системой капельного полива и роликовым грядообразователем