Поиск по публикациям и новостям

Алгоритм для выявления деструктивной информации создали в НГУ
Работа проводилась совместно с коллегами из Казахстана

Учёные Новосибирского государственного университета (НГУ) в сотрудничестве с коллегами из Казахстана разработали алгоритм, позволяющий находить деструктивную информацию в Сети. Поиск осуществляется на русском и казахском языках.

Анализ казахских слов проводится на основе морфологических особенностей языка. Алгоритм анализировует слова, определяет их начальную форму или образует другие формы на её основе. Такой подход важен для смыслового анализа больших текстов или поиска в Сети.

Мы провели анализ новостей в казахстанском сегменте Интернета на казахском и русском языках, собрав обширный дата-сет. В частности, мы исследовали деструктивную информацию и научились определять ее по ряду признаков.
Владимир Барахнин, заведующий кафедрой математического моделирования механико-математического факультета НГУ.

Учёный объяснил, что одним из признаков деструктивной информации является призыв к действиям. Также специалисты классифицировали информацию по достоверности данных и выводам, сделанным авторами публикаций.

В исследовании был задействован корпус казахстанских СМИ. Он включал более 4 миллионов публикаций из 36 источников. Также использовались более 2 млн текстов российских СМИ.

Деструктивная информация определялась с помощью методов машинного обучения и искусственного интеллекта на основе таких критериев, как отсутствие проверяемых фактов, политизация, призыв к действию, негативная тональность и манипулятивность.
Владимир Барахнин

Учёные НГУ совместно с сотрудниками Казахского национального технического университета имени К. И. Сатпаева продолжают исследования. Они разрабатывают онтологию в области обработки естественного языка на трех языках. Она позволит обучать большие языковые модели

Читайте ещё по теме:

Нейросеть GigaChat научат удмуртскому языку

В МТУСИ научат нейросеть читать повреждённые штрихкоды

Нейросеть для создания фильмов и сериалов разработали в Москве

Источники
ИА «ТАСС»

Сейчас на главной

59 секунд назад
«Завершается монтаж»: назван точный срок сертификационных полётов импортозамещённого самолёта МС-21

Полностью русифицированная версия лайнера поднимется в небо летом 2025 года

5 минут назад
Рособоронэкспорт представил новейший РЛК-МЦЕ «Валдай» для борьбы с дронами-камикадзе

Комплекс способен обнаружить БПЛА на предельно малой высоте на дальности до 20 км

5 минут назад
Выше только космос: строевой истребитель МиГ-29 поднялся на высоту 22 500 метров

По ТТХ практический потолок полета самолета — не более 18 000 метров

1 час назад
АвтоВАЗ: уровень локализации Lada превысил 90%

В линейке автомобилей класса B и B+ бренд не уступает мировому автопрому

1 час назад
«Мандраж, будто на сборке первые машины». АвтоВАЗ вовсю готовится к запуску Lada Iskra в серийное производство

Производитель уже собрал новую партию автомобилей в кузовах седан и универсал

1 час назад
Производитель стратегических ракет «Тополь-М» и «Искандер-М» остался без нового станка с ЧПУ

Арбитражный суд внес поставщика, «Уральскую станочную компанию», в реестр недобросовестных

3 часа назад
Машины до 1,7 миллиона рублей: рейтинг самых недорогих автомобилей составили в России

Первые три строчки списка заняли отечественные марки

3 часа назад
Сотрудники российской компании Smart Engines достигли значительного успеха в сфере код-ревью

Уникальная технология позволяет вводить и проверять перфокарты с помощью томографа

4 часа назад
Совсем не до смеха!: масштабный сбой произошел в базе ГАИ

Технические проблемы спровоцировали огромные очереди и парализовали рабочие процессы ведомства

4 часа назад
С четырьмя кроватями, современной кухней и кондиционером: новый автодом на базе «ГАЗели» создали в России

Автодом оснащен генератором и двумя гелевыми аккумуляторами

4 часа назад
Терагерцовое излучение помогло российским учёным найти способ ускорить передачу данных

Инновационные материалы показали низкие энергозатраты при записи данных и устойчивость к помехам

4 часа назад
Сбер исключил возможность кражи денег со счетов с помощью записи голоса или фото

Основные риски безопасности обусловлены не уязвимостями биометрических систем, а человеческим фактором