Поиск по публикациям и новостям

«Шиншилла» больше не проблема: российские учёные научили нейросеть точно распознавать это рукописное слово
Новая технология от Smart Engines исключает ошибки ИИ при чтении редких слов и улучшает обработку документов

Учёные компании Smart Engines разработали нейросеть, способную распознавать рукописное слово «шиншилла» без использования языкового контекста. Это достижение решает ключевую проблему «галлюцинаций» ИИ — ситуаций, когда система подменяет редкие или сложные слова на более распространенные. Технология уже внедрена в системы распознавания российских паспортов, применяемые крупными банками и телеком-операторами.

Как пояснили в компании, слово «шиншилла» стало своеобразным тестом Тьюринга для кириллических OCR-систем: при неаккуратном почерке буквы «ш», «и», «л» визуально сливаются.

Нейросеть «Да Винчи» обучена на 1,2 млн строк синтезированного рукописного текста с равномерным распределением букв. Это позволяет избежать зависимости от языковых шаблонов.

По словам генерального директора Smart Engines Владимира Арлазарова, при обработке документов критически важно считывать именно написанное, а не «исправлять» ошибки на основе контекста.

Технология Smart Engines отличается от традиционных OCR-решений, таких как ABBYY FineReader или Tesseract, которые часто полагаются на языковые модели. Например, зарубежные аналоги могут заменять редкие слова на похожие по контексту, что недопустимо в юридических документах. Разработка российских ученых особенно актуальна для обработки имен собственных, номеров и официальных печатей, где точность превыше всего.

Читать ещё материалы по теме:

Smart Engines представила сервис для распознавания и проверки документов — Smart ID Engine 2.5

В России придумали революционный метод диагностики турбореактивных двигателей в собранном состоянии

Что скрывал Пушкин?: Учёные расшифровали рукописи поэта при помощи нейросети «Да Винчи»

Источники
РИА «Новости»

Сейчас на главной

47 минут назад
Продажи модернизированной Lada Niva Sport запустят 5 апреля

Доработанная версия автомобиля будет отличаться не только повышенной мощностью, но и обновлённой ходовой частью

52 минуты назад
Новейшая Lada Largus в цвете «Капитан» попала на фото

Машину в синем цвете засняли на конвейере

1 час назад
«Яндекс Путешествия» снова обновили: в сервис добавили чаты для общения путешественников и арендодателей

Чат позволяет уточнить детали об объекте размещения до заезда

1 час назад
Wildberries внедрит обязательное указание IMEI для смартфонов

Проверять код будут на этапе приёмки товара для его отправки в пункт выдачи

1 час назад
Уверенный шаг и никакой усталости: МПО «Металлист» разработало карбоновый протез стопы «Авантаж»

Изделие состоит из пяточного элемента, киля и адаптера-пирамидки

1 час назад
С душем, телевизором и дизайнерским салоном: ГАЗ-2330 «Тигр» 2004 года продают в Москве

Внедорожник превратили из военной версии в гражданскую

1 час назад
С нулевым пробегом: раритетный российского спорткар Marussia B1 2015 года продают в Москве

Под брендом Marussia создали всего 4 серийный автомобиля

2 часа назад
Новейший ЗРПК «Панцирь-СМ» подтвердил способность перехвата MGM-140B ATACMS Block IA ракетой 57Э6М методом «hit-to-kill»

Двухступенчатая ЗУР оснащена боевой частью типа «Завеса»

2 часа назад
Атомная подлодка «Пермь» станет первым штатным носителем гиперзвуковой ракеты «Циркон»

Субмарина проекта 885М конструктивно будет немного отличаться от предшественниц

2 часа назад
Серпом по дронам: «Росэлектроника» разработала новейший комплекс РЭБ с 13 рабочими частотами для борьбы с БПЛА

«СЕРП-ВС13Д» воплотил в себе сочетание комплекса радиоэлектронной борьбы и высокоточного детектора

2 часа назад
Отказались от деталей харьковского завода: KMZ испытал советский двигатель Д100 с новыми комплектующими

Силовой агрегат модернизировали для нужд «Росэнергоатома»

3 часа назад
Для виноделов Крыма и Краснодарского края: МТЗ представил модернизированный трактор BELARUS 921

Спецтехника получила двигатель мощностью 95 л.с. и улучшенную трансмиссию