Científicos del MIPT han desarrollado una nueva estructura de neurona morfológica bipolar – un análogo simplificado de las neuronas artificiales tradicionales – y han propuesto un método de aprendizaje capaz de aumentar la eficiencia computacional de las redes neuronales.
La nueva forma de construir una red neuronal muestra altos resultados incluso con una estructura neuronal simplificada. Este enfoque abre posibilidades para crear sistemas de inteligencia artificial más eficientes energéticamente y rápidos, lo cual es especialmente relevante, dado que la mayoría de los modelos de IA modernos se basan en operaciones de suma y multiplicación, siendo la multiplicación la que requiere mucha más potencia computacional.
Una alternativa a las neuronas tradicionales son las neuronas morfológicas bipolares, en las que la operación de multiplicación se sustituye por la obtención del máximo. Aunque las redes neuronales basadas en ellas pueden tener una ventaja en eficiencia energética, su aprendizaje presentaba una seria dificultad debido al aumento del número de ramas computacionales.
Investigadores rusos lograron crear un nuevo modelo de tal neurona, que reduce el número de ramas de cuatro a una. El nuevo método de aprendizaje, basado en la destilación de conocimientos – la transferencia de información de una red "profesora" a una red en aprendizaje – permite alcanzar una precisión comparable a la de los modelos clásicos. Las pruebas experimentales de análogos de LeNet y ResNet-22, sistemas populares para el reconocimiento de imágenes y texto manuscrito, mostraron que la nueva arquitectura supera las pruebas al mismo nivel que sus análogos tradicionales.
En el futuro, el desarrollo de tales modelos energéticamente eficientes y de alto rendimiento permitirá crear algoritmos más económicos para tareas que requieran importantes recursos computacionales, lo que podría ser un paso importante en el desarrollo de las tecnologías de inteligencia artificial.
Leer materiales sobre el tema:
Se ha desarrollado un sistema de IA para detectar errores en los cálculos cuánticos