Новый инструмент искусственного интеллекта может помочь исследователям обнаружить ранее неизвестные белки и разработать совершенно новые. Это может помочь в разработке более эффективных вакцин, ускорить исследования лекарства от рака или привести к совершенно новым открытиям.
Принадлежащая Alphabet лаборатория искусственного интеллекта DeepMind удивила мир в 2020 году, когда анонсировала AlphaFold, инструмент искусственного интеллекта, который использовал глубокое обучение для решения одной из «главных задач» биологии: точного предсказания формы белков. Белки имеют основополагающее значение для жизни, и понимание их формы жизненно важно для работы с ними. Ранее DeepMind объявила, что AlphaFold теперь может предсказывать форму всех белков, известных науке.
Новый инструмент ProteinMPNN, описанный группой исследователей из Вашингтонского университета в статьях, опубликованных в журнале Science (доступны здесь и здесь ), предлагает мощное дополнение к этой технологии.
Документы являются последним примером того, как глубокое обучение революционизирует дизайн белков, предоставляя ученым новые исследовательские инструменты. Традиционно исследователи разрабатывают белки, модифицируя те, которые встречаются в природе, но ProteinMPNN откроет исследователям целую новую вселенную возможных белков для разработки с нуля.
«В природе белки решают практически все проблемы жизни, начиная от сбора энергии солнечного света и заканчивая созданием молекул. Все в биологии происходит из белков», — говорит Дэвид Бейкер, один из авторов статьи и директор Института белкового дизайна Вашингтонского университета – «Они развивались в ходе эволюции, чтобы решать проблемы, с которыми организмы сталкивались в ходе эволюции. Но сегодня мы сталкиваемся с новыми проблемами, такими как covid. Если бы мы могли разработать белки, которые были бы так же хороши для решения новых проблем, как те, которые эволюционировали в ходе эволюции, решают старые проблемы, это было бы очень, очень мощно».
Белки состоят из сотен и тысяч аминокислот, соединенных в длинные цепочки, которые затем складываются в трехмерные формы. AlphaFold помогает исследователям прогнозировать результирующую структуру, давая представление о том, как она будет себя вести.
ProteinMPNN поможет исследователям решить обратную задачу. Если они уже имеют в виду точную структуру белка, это поможет им найти последовательность аминокислот, которая складывается в эту форму. В системе используется нейронная сеть, обученная на очень большом количестве примеров последовательностей аминокислот, которые складываются в трехмерные структуры.
«Возможность использовать машинное обучение для разработки белков таким образом — это очень важное дело», — говорит Линн Риган, профессор биохимии и биотехнологии в Эдинбургском университете.
AlphaFold открыла новую эру в биологии, решив проблему прогнозирования структуры белка и продемонстрировав преобразующую роль, которую ИИ и машинное обучение будут играть в биологии. ProteinMPNN — еще одно доказательство этого сдвига парадигмы разработки белков для конкретных задач.
ProteinMPNN, который теперь доступен бесплатно в репозитории программного обеспечения с открытым исходным кодом GitHub