ИИ не сломать: в НИЯУ МИФИ создали нейросеть, устойчивую к «отравлению» данных

Даже если в обучение подмешают вредоносные данные, ИИ-система сохраняет точность выше 97%

Исследователи Национального исследовательского ядерного университета МИФИ разработали новую архитектуру нейросети под названием MambaShield, которая устойчива к так называемым атакам «отравления» данных (data poisoning).

Чем опасно «отравление» данных для ИИ

Такие атаки — одна из главных угроз для современных систем машинного обучения. Например, когда злоумышленник постепенно внедряет в обучающие данные искажённые примеры, и модель начинает обучаться неправильно.

В результате точность может резко упасть — с 95% до 40%. Это особенно опасно для кибербезопасности, беспилотного транспорта, финансов и промышленности.

Как устроена нейросеть от МИФИ

MambaShield умеет отсеивать вредоносные данные ещё на этапе обучения и не даёт им повлиять на результат. Даже если до 30% обучающей выборки окажется заражённой, точность системы остаётся выше 97%. При этом она работает в 4,2 раза быстрее, чем классические трансформеры.

Архитектура основана на селективных моделях в пространстве состояний. Проще говоря, система сама решает, какие данные оставить, а какие отбросить, фильтруя вредоносные примеры.

В основе MambaShield — сразу три технологии. Прогрессивная дистилляция устойчивости (PARD) позволяет передавать знания от нескольких моделей к одной компактной. Иерархическое обучение с подкреплением (HRL) помогает системе адаптироваться к меняющемуся поведению атакующего в реальном времени. А PAC-Bayesian сертификация даёт математические гарантии устойчивости — даже при значительном «отравлении» данных.

Эксперименты на наборах данных о кибератаках (CIC-IoT-2023, CSE-CICIDS2018, UNSW-NB15) показали: точность обнаружения достигает 99,1%, тогда как у аналогов — около 97%. При атаке она падает всего на 2–3%, в то время как у обычных моделей — на 18–20%.

Есть и ограничения. При работе с очень длинными последовательностями (более 5000 шагов) могут накапливаться ошибки округления. А если вредоносных данных становится слишком много (более 50–70%), любая система начинает давать сбои.

Потенциал для промышленного внедрения

MambaShield уже рассматривается как основа для создания доверенного ИИ. Такие решения можно применять на атомных станциях, в финансовой сфере и медицине, где особенно важны точность и устойчивость.

Разработка опубликована в журнале Expert Systems with Applications и получила грант Минэкономразвития России.

Читайте ещё материалы по теме:

06:46 Новости
АФК «Система» раскрыла цену входа в высшую лигу ИИ для России Один цикл обучения модели в 100 трлн параметров обойдётся в 10 млрд долларов
01 июн 17:17 Новости
Вузы ищут защиту от ИИ: дипломы могут заменить проектами и практическими кейсами Итоговую аттестацию предлагают смещать в сторону стартапов, портфолио и устной защиты
01 июн 16:44 Новости
Плюсы, минусы и рекомендация: Wildberries тестирует ИИ-помощника для выбора товаров «Умное сравнение» покажет отличия между похожими позициями прямо в приложении
31 мая 16:02 Новости
Школьник спросил ИИ — и перестал думать: академик РАН оценил риск нейросетей Владислав Лекторский предупредил о слепом доверии учеников к ChatGPT
31 мая 14:58 Новости
Нейросети не заменят священника: в РПЦ назвали пределы цифровых технологий Владимир Легойда рассказал, где церковь готова использовать ИИ, а где видит границу

Сейчас на главной

Кластер микроэлектроники и фотоники появится в Петербурге на базе ЦНИИ «Электрон»
5 часов назад

Первая в городе научно-производственная зона полного цикла объединит инжиниринг, прототипирование и испытания