Científicos rusos del Instituto de Inteligencia Artificial AIRI han desarrollado un sistema universal de visión artificial para el reconocimiento tridimensional de objetos, que funciona igual de bien con diferentes conjuntos de pruebas. El desarrollo se puede aplicar en robótica, realidad aumentada y escaneo 3D.
Anteriormente, era necesario crear modelos separados para cada conjunto de datos, lo que ralentizaba el proceso de desarrollo. El nuevo sistema, basado en un transformador-codificador puro, simplifica y acelera este proceso.
La creación de sistemas de visión artificial tridimensional está limitada por conjuntos de datos pequeños y heterogéneos. El conjunto de datos más grande contiene solo alrededor de 7 mil escenas, que es varias veces menor que los millones de imágenes para modelos generativos.
Para solucionar el problema, los científicos rusos crearon una red neuronal universal basada en un transformador-codificador sin optimizaciones para conjuntos de datos específicos y realizaron un reetiquetado a gran escala para reducir el número de clases de objetos.
Los experimentos demostraron que el nuevo modelo funciona eficazmente con un gran número de conjuntos de datos heterogéneos y reconoce objetos en diferentes tipos de "nubes de puntos" de radares láser y escáneres tridimensionales. Los científicos esperan que el desarrollo acelere la creación de sistemas de visión tridimensional y mejore la calidad de su trabajo.
Lea también sobre el tema:
Alikhanov muestra el primer tractor robot ruso con IA de Cognitive Pilot
Científicos rusos desarrollan un dispositivo neuromórfico para la búsqueda de hidrocarburos