Российские учёные заметно прокачали точность нейросетей в одной из самых сложных задач биологии — прогнозировании взаимодействий между белками. Новый подход позволяет предсказывать такие процессы с точностью до 95,7%, что открывает дополнительные возможности для разработки лекарств и изучения заболеваний.
Работа опубликована в журнале Scientific Reports. Исследование провела команда под руководством директора Центра биомедицинских исследований Института искусственного интеллекта и цифровых наук НИУ ВШЭ Марии Попцовой.
Главная идея — учитывать не только структуру и последовательность белков, как это делают большинство существующих моделей, но и свойства их поверхности. Именно этот фактор часто упускается, хотя он критически важен для понимания того, как молекулы «взаимодействуют» друг с другом.
В основе метода — комбинация нескольких типов нейросетей, которые одновременно анализируют аминокислотную последовательность, трёхмерную структуру и физические характеристики поверхности белков. Такой подход позволяет значительно повысить точность по сравнению с популярными алгоритмами вроде GCN и GAT.
Технологию протестировали на одном из крупнейших наборов данных по белковым взаимодействиям. В результате новая модель показала точность 95,7% — выше, чем у существующих решений.
Для науки это важный шаг: сбои во взаимодействиях белков лежат в основе множества заболеваний. Чем точнее удаётся предсказывать такие процессы, тем быстрее можно находить потенциальные «мишени» для лекарств и лучше понимать механизмы болезней — без дорогих и долгих экспериментов.