Учёные Новосибирского государственного университета (НГУ) в сотрудничестве с коллегами из Казахстана разработали алгоритм, позволяющий находить деструктивную информацию в Сети. Поиск осуществляется на русском и казахском языках.
Анализ казахских слов проводится на основе морфологических особенностей языка. Алгоритм анализировует слова, определяет их начальную форму или образует другие формы на её основе. Такой подход важен для смыслового анализа больших текстов или поиска в Сети.
Учёный объяснил, что одним из признаков деструктивной информации является призыв к действиям. Также специалисты классифицировали информацию по достоверности данных и выводам, сделанным авторами публикаций.
В исследовании был задействован корпус казахстанских СМИ. Он включал более 4 миллионов публикаций из 36 источников. Также использовались более 2 млн текстов российских СМИ.
Учёные НГУ совместно с сотрудниками Казахского национального технического университета имени К. И. Сатпаева продолжают исследования. Они разрабатывают онтологию в области обработки естественного языка на трех языках. Она позволит обучать большие языковые модели
Нейросеть GigaChat научат удмуртскому языку
В МТУСИ научат нейросеть читать повреждённые штрихкоды
Нейросеть для создания фильмов и сериалов разработали в Москве