В России на базе Ассоциации больших данных и при участии Сбера разрабатывается предварительный проект национального стандарта синтеза данных. Цель стандарта — улучшить доступность, безопасность и качество данных, необходимых для развития искусственного интеллекта.
Основная задача стандарта заключается в описании технологии создания конфиденциальных синтетических данных, что позволит развивать технологии ИИ с соблюдением приватности на всех этапах синтезирования.
В документе представлены математические доказательства, подтверждающие, что соблюдение рекомендаций стандарта позволяет синтезировать данные без риска утечки конфиденциальной информации. Безопасность достигается путём нахождения оптимального баланса между защитой приватности и качеством получаемых наборов данных.
Синтетические данные становятся реальной альтернативой обезличенным данным, которые сегодня зачастую скованы излишними регуляторными ограничениями. При соблюдении требований приватности синтетические данные не несут в себе рисков и открывают прорывной путь к достижению целей по доступности данных, необходимых для обучения искусственного интеллекта
Утверждение стандарта в 2025 году станет важным шагом к интеграции синтетических данных в широкий оборот в стране, считают эксперты.
Читайте ещё по теме:
Сбер выпустил нейросеть GigaChat Max
В Яндексе придумали способ сжатия нейросетей
В России создан индекс для оценки этичности систем искусственного интеллекта в медицине