Российские и казахстанские исследователи создали инновационную методику поиска уязвимостей в коде с помощью искусственного интеллекта. Она работает быстрее и эффективнее, чем традиционные статические анализаторы кода. Об этом сообщила пресс-служба Сбербанка.
Работа вносит весомый вклад в развитие технологий на стыке искусственного интеллекта и кибербезопасности, предлагая эффективный инструмент для поиска уязвимостей цифровой инфраструктуры. В эпоху цифровой трансформации подобные технологии становятся стратегически важными для защиты данных клиентов и бизнес-процессов бизнеса.
Разработчики программного обеспечения для проверки безопасности используют статические анализаторы — алгоритмы, которые анализируют каждую строчку кода, их последовательности и весь проект в целом. Эти инструменты проверяют соответствие кода нормам и практикам языков программирования. Однако создание таких систем требует много времени и ресурсов, поэтому ученые ищут более эффективные методы.
Исследователи из Центра практического искусственного интеллекта Сбербанка совместно с коллегами из России и Казахстана создали метод, позволяющий применять большие языковые модели для написания кода. В ходе исследования они использовали нейросеть WizardCoder, предварительно обученную на обширном наборе данных. Затем модель была дообучена, чтобы находить только ошибки в коде.
Специалисты отмечают, что при создании этой системы они существенно улучшили качество обучающих данных. Они отобрали только те примеры, где точно есть уязвимости в коде. Также разработчики смогли найти оптимальное количество примеров для каждого этапа обучения. Это позволило ускорить процесс дообучения примерно в 13 раз. В результате учёные создали ИИ-систему, которая значительно превосходит другие большие языковые модели по способности находить и отмечать потенциальные уязвимости.
Эксперты создали набор отрывков кода на Java для тестирования новой системы. Они отметили уязвимости точнее, чем в других открытых источниках. Тесты показали, что система лучше выявляет уязвимости по сравнению с существующими ИИ-подходами. В простых случаях она превзошла их на 4-5%, а в сложных — на 22%. Это подтверждает эффективность больших языковых моделей для анализа кода.
Ранее на конференции GigaConf 2025 компания СберТех представила GigaStudio — инновационный инструмент для создания веб-приложенийс помощью генеративного ИИ. Решение работает в режиме диалога: пользователь описывает свою идею в текстовом запросе, и система автоматически генерирует рабочий прототип.
Читайте ещё материалы по теме:
Облачный сервис для складской логистики с ИИ-аналитикой представили в НГТУ
На страже порядка: ИИ будет докладывать о заполненности мусорных баков
ИИ в службе поддержки: через пару лет большинство обращений россиян будут обрабатывать нейросети