Yandex ha actualizado su servicio "Búsqueda en archivos": ahora no solo reconoce texto en documentos históricos, sino que también comprende la estructura del registro. El nuevo modelo puede identificar a los participantes de un evento, determinar sus roles y las relaciones entre las personas.
Anteriormente, los usuarios tenían que buscar a la persona deseada entre todas las menciones en el archivo, junto con notas de servicio, fechas y otros nombres. Después de la actualización, la búsqueda se ha vuelto más precisa: ahora se puede especificar no solo el nombre completo, sino también el contexto del evento. Por ejemplo, al buscar un registro de nacimiento, se pueden indicar los roles de "nacido", "padre" o "madre", y al trabajar con un certificado de matrimonio, "novio", "novia" o "testigo".
La actualización se basa en el modelo multimodal de Yandex, Alice AI VLM. Funciona con texto e imágenes, y también comprende bien el idioma ruso, lo cual es especialmente importante para los documentos de archivo. Gracias a esto, los desarrolladores no tuvieron que recopilar enormes conjuntos de datos de entrenamiento: el modelo pudo dominar la extracción de datos en un pequeño número de iteraciones con un marcado especializado.
La calidad del sistema se evaluó por la proporción de personas que se pueden encontrar por su nombre completo en la búsqueda de archivos. La precisión promedio fue del 90,5%. Para los registros de nacimiento, el indicador alcanzó el 92,7%, para los documentos matrimoniales, el 89,7%, y para los registros de defunción, el 87,2%.
La "Búsqueda en archivos" ayuda a encontrar menciones de personas, asentamientos y eventos en documentos manuscritos de los siglos XVIII al XX, que son descifrados por una red neuronal. La base de datos del servicio ya contiene más de 20 millones de páginas de documentos históricos de los archivos de Moscow, Moscow, Orenburg, Vologda, Irkutsk, Astrakhan y otras regiones. Además, el servicio busca datos en más de 200 periódicos prerrevolucionarios y soviéticos, así como en directorios.
Leer más sobre este tema:
IA en lugar de la búsqueda eterna: cómo "Alisa AI" es utilizada por profesionales de TI, abogados y especialistas en marketing
Archivos militares conectados a "Alisa AI": la red neuronal busca participantes de la Gran Guerra Patria en minutos- En "Yandex Mail" apareció un secretario de IA: "Alisa Pro" lee y responde

Комментарии