En Rusia, sobre la base de la Asociación de Big Data y con la participación de Sber, se está desarrollando un proyecto preliminar de un estándar nacional para la síntesis de datos. El objetivo del estándar es mejorar la accesibilidad, la seguridad y la calidad de los datos necesarios para el desarrollo de la inteligencia artificial.
La tarea principal del estándar es describir la tecnología para crear datos sintéticos confidenciales, lo que permitirá desarrollar tecnologías de IA respetando la privacidad en todas las etapas de la síntesis.
El documento presenta pruebas matemáticas que confirman que el cumplimiento de las recomendaciones del estándar permite sintetizar datos sin riesgo de fuga de información confidencial. La seguridad se logra encontrando un equilibrio óptimo entre la protección de la privacidad y la calidad de los conjuntos de datos resultantes.
Los datos sintéticos se están convirtiendo en una alternativa real a los datos anonimizados, que hoy en día a menudo están sujetos a restricciones regulatorias excesivas. Si se cumplen los requisitos de privacidad, los datos sintéticos no conllevan riesgos y abren un camino innovador para lograr los objetivos de accesibilidad de los datos necesarios para el aprendizaje de la inteligencia artificial
Los expertos creen que la aprobación del estándar en 2025 será un paso importante hacia la integración de los datos sintéticos en una amplia circulación en el país.
Lea más sobre el tema:
Sber lanzó la red neuronal GigaChat Max