La red neuronal rusa LAPUSKA: el desarrollo de la Universidad Nacional de Ciencia y Tecnología MISIS y la Escuela Superior de Economía promete mejorar la calidad de las fotos el doble de rápido

Científicos de MISIS y la Escuela Superior de Economía han creado una nueva red neuronal que ayudará a reconocer rostros más rápido

Científicos de la Universidad Nacional de Ciencia y Tecnología MISIS y la Escuela Superior de Economía han presentado la innovadora red neuronal LAPUSKA (LaPlacian UpScale Knowledge Alignment), que promete una mejora significativa en la calidad de las imágenes. Este nuevo enfoque en el procesamiento de imágenes acelera el proceso al doble en comparación con modelos similares. Según las previsiones, el desarrollo ayudará a mejorar el reconocimiento facial y aumentar la precisión del procesamiento de imágenes.

El análisis e interpretación de imágenes mediante visión artificial ya se utiliza ampliamente en medicina, agricultura, transporte e industria del entretenimiento. Una de las direcciones prometedoras del desarrollo de esta tecnología es la superresolución de imágenes, que no solo aumenta el tamaño, sino que también mejora significativamente su calidad. Esto abre nuevas oportunidades para obtener más información y detalles, antes inaccesibles al ojo humano con baja resolución de las fotografías.

La tecnología de obtención de imágenes de súper alta resolución es prometedora en diversos campos. Ayuda a aumentar la calidad de las imágenes de las cámaras de video para el reconocimiento de rostros o matrículas de automóviles en el ámbito de la seguridad. Además, esta red neuronal ayudará a mejorar la calidad de las fotografías, restaurando imágenes antiguas o dañadas, así como imágenes tomadas en condiciones de iluminación difíciles o a gran distancia.

Los modelos existentes para obtener imágenes de alta resolución tienen ciertas desventajas. Por ejemplo, los modelos neuronales populares SRGAN y LapSRN requieren una gran potencia de cálculo y volumen de memoria, lo que limita su disponibilidad y requiere un tiempo considerable para el procesamiento de imágenes. El modelo LapSRN crea imágenes más suaves, pero reduce algunos detalles pequeños. A su vez, SRGAN conserva mucho ruido digital.

La nueva arquitectura de la red neuronal LAPUSKA combina las mejores características de los modelos SRGAN y LapSRN, evitando sus desventajas. Ofrece una calidad comparable a LapSRN, pero procesa las imágenes el doble de rápido.

Ilya Makarov, director del centro de inteligencia artificial de la Universidad Nacional de Ciencia y Tecnología MISIS, jefe del grupo «IA en la industria» del Instituto AIRI
Ilya Makarov, director del centro de inteligencia artificial de la Universidad Nacional de Ciencia y Tecnología MISIS, jefe del grupo «IA en la industria» del Instituto AIRI

Ilya Makarov, coautor de la investigación y director del centro de inteligencia artificial de la Universidad Nacional de Ciencia y Tecnología MISIS, explicó que la arquitectura LAPUSKA incluye varias capas convolucionales de diferente estructura, basándose en SRGAN, que muestra los mejores resultados de aprendizaje. Utiliza una estrategia de post-muestreo para extraer características de los datos de entrada y escalar la imagen al final del proceso. Los desarrolladores utilizaron el conjunto de datos DIV2K con 800 imágenes RGB HR en color de entrenamiento y las correspondientes imágenes LR reducidas con diferentes coeficientes.

La investigación se llevó a cabo en el marco del proyecto estratégico «Negocio Digital» de la Universidad Nacional de Ciencia y Tecnología MISIS dentro del programa «Prioridad 2030» del Ministerio de Ciencia y Educación Superior de Rusia.

Ahora en la página principal