"Chinchilla" ya no es un problema: científicos rusos enseñaron a la red neuronal a reconocer con precisión esta palabra manuscrita

La nueva tecnología de Smart Engines elimina los errores de la IA al leer palabras raras y mejora el procesamiento de documentos

Científicos de la empresa Smart Engines han desarrollado una red neuronal capaz de reconocer la palabra manuscrita «chinchilla» sin utilizar el contexto lingüístico. Este logro resuelve un problema clave de las «alucinaciones» de la IA: situaciones en las que el sistema sustituye palabras raras o complejas por otras más comunes. La tecnología ya se ha внедрена en los sistemas de reconocimiento de pasaportes rusos utilizados por los principales bancos y operadores de telecomunicaciones.

Como explicaron en la empresa, la palabra «chinchilla» se ha convertido en una especie de test de Turing para los sistemas OCR cirílicos: con una letra descuidada, las letras «ш», «и», «л» se fusionan visualmente.

La red neuronal «Da Vinci» está entrenada con 1,2 millones de líneas de texto manuscrito sintetizado con una distribución uniforme de las letras. Esto permite evitar la dependencia de patrones lingüísticos.

Según el director general de Smart Engines, Vladimir Arlazárov, al procesar documentos es fundamental leer exactamente lo que está escrito y no «corregir» los errores basándose en el contexto.

La tecnología de Smart Engines se diferencia de las soluciones OCR tradicionales, como ABBYY FineReader o Tesseract, que a menudo se basan en modelos lingüísticos. Por ejemplo, los análogos extranjeros pueden sustituir palabras raras por otras similares en contexto, lo que es inaceptable en documentos jurídicos. El desarrollo de los científicos rusos es especialmente relevante para el procesamiento de nombres propios, números y sellos oficiales, donde la precisión es primordial.

Leer más materiales sobre el tema:

Smart Engines presentó un servicio para el reconocimiento y la verificación de documentos: Smart ID Engine 2.5

En Rusia se inventó un método revolucionario para diagnosticar motores turborreactivos en estado ensamblado

¿Qué ocultaba Pushkin?: Científicos descifraron los manuscritos del poeta con la ayuda de la red neuronal «Da Vinci»

Ahora en la página principal