Новые горизонты для ИИ: в России разрабатывают национальный стандарт синтеза данных

В России на базе Ассоциации больших данных и при участии Сбера разрабатывается предварительный проект национального стандарта синтеза данных. Цель стандарта — улучшить доступность, безопасность и качество данных, необходимых для развития искусственного интеллекта.

Источник изображения: сгенерировано нейросетью DALL•Е 3

Основная задача стандарта заключается в описании технологии создания конфиденциальных синтетических данных, что позволит развивать технологии ИИ с соблюдением приватности на всех этапах синтезирования.

В документе представлены математические доказательства, подтверждающие, что соблюдение рекомендаций стандарта позволяет синтезировать данные без риска утечки конфиденциальной информации. Безопасность достигается путём нахождения оптимального баланса между защитой приватности и качеством получаемых наборов данных.

Синтетические данные становятся реальной альтернативой обезличенным данным, которые сегодня зачастую скованы излишними регуляторными ограничениями. При соблюдении требований приватности синтетические данные не несут в себе рисков и открывают прорывной путь к достижению целей по доступности данных, необходимых для обучения искусственного интеллекта
Анна Серебряникова, президент Ассоциации больших данных

Утверждение стандарта в 2025 году станет важным шагом к интеграции синтетических данных в широкий оборот в стране, считают эксперты.

Читайте ещё по теме:

Сбер выпустил нейросеть GigaChat Max

В Яндексе придумали способ сжатия нейросетей

В России создан индекс для оценки этичности систем искусственного интеллекта в медицине