Учёные из «Сколтеха» разработали алгоритм на основе генеративного искусственного интеллекта, способный восстанавливать недостающие данные о расположении генов в ДНК. Этот метод позволяет с высокой точностью определять расстояния между генами даже при неполных исходных данных, что может значительно ускорить исследования в области генетики и медицины.

Как пояснил старший преподаватель «Сколтеха» Кирилл Половников, задача определения расстояний между генами по ограниченному набору данных сводится к математической проблеме, которую теперь можно решать с помощью генеративных моделей.
Если узнать расстояния между достаточным количеством пар генов, поиск расстояний между остальными парами, для которых нет экспериментальных данных, принимает вид математической задачи с конкретным решением. Мы впервые показали, что такие задачи могут решать генеративные модели, что является нетипичной сферой для их применения.
Геном человека состоит из длинных нитей ДНК, упакованных в хромосомы. Понимание их трехмерной структуры важно для изучения работы генов и их влияния на развитие заболеваний. Традиционные методы, такие как флуоресцентная микроскопия (FISH), не всегда позволяют получить полные данные из-за технических ограничений. Российские ученые предложили использовать генеративный ИИ для заполнения этих пробелов, аналогично тому, как нейросети дорисовывают изображения.
В ходе эксперимента алгоритм DDRM успешно восстановил пропущенные данные на участке 21-й хромосомы человека, превзойдя классические методы. Это открывает перспективы для более быстрого и точного анализа генома, что критически важно для разработки новых лекарств и методов диагностики наследственных заболеваний.
Читайте ещё материалы по теме:
Метод ускоренного дообучения нейросетей представлен исследователями из ВШЭ и AIRI
Новое слово в неинвазивной терапии рака: особые наночастицы были созданы учёными МИИ ИМ ЮФУ