Нобелевская премия по химии 2024 года присуждена: Дэвиду Бейкеру «за вычислительный дизайн белков», а также — совместно Демису Хассабису и Джону Джамперу «за предсказание структуры белков».
Нобелевская премия по химии 2024 года посвящена белкам, химическим инструментам жизни. Дэвид Бейкер преуспел в создании совершенно новых видов белков. Демис Хассабис и Джон Джампер разработали модель ИИ для решения 50-летней проблемы: предсказания сложных структур белков.
Разнообразие жизни свидетельствует об удивительных особенностях белков как химических инструментов. Они контролируют и управляют всеми химическими реакциями, которые являются основой жизни. Белки также выполняют функции гормонов, сигнальных веществ, антител и строительных блоков различных тканей.
Белки обычно состоят из 20 различных аминокислот, которые можно описать как строительные блоки жизни. В 2003 году Дэвид Бейкер создал новый белок, который не был похож ни на один другой. С тех пор его исследовательская группа создавала белки один за другим, включая те, что можно использовать в качестве фармацевтических препаратов, вакцин, наноматериалов и крошечных датчиков.
Второе открытие касается предсказания структур белков. В белках аминокислоты связаны вместе в длинные нити, которые складываются, образуя трехмерную структуру, которая имеет решающее значение для функции белка. С 1970-х годов исследователи пытались предсказать структуры белков из последовательностей аминокислот, но это было крайне сложно. Однако ошеломляющий прорыв произошел четыре года назад.
В 2020 году Демис Хассабис и Джон Джампер представили модель ИИ под названием AlphaFold2. С ее помощью они смогли предсказать структуру практически всех 200 миллионов белков, с которыми работали исследователи. С тех пор AlphaFold2 использовали более двух миллионов человек из 190 стран. Открытие приносит колоссальную пользу. Ученые, например, теперь могут лучше понять устойчивость к антибиотикам и создавать изображения ферментов, которые могут разлагать пластик.
Жизнь не могла бы существовать без белков. То, что мы теперь можем предсказывать структуры белков и проектировать наши собственные белки, дало человечеству огромный шаг вперед.
Что создает бурную химию жизни?
Используя информацию, хранящуюся в ДНК в качестве чертежа, аминокислоты соединяются вместе в наших клетках, образуя длинные цепочки.
Затем происходит магия белков: цепочка аминокислот скручивается и сворачивается в отчетливую – иногда уникальную – трехмерную структуру. Именно от этой структуры зависит, какую функцию будет выполнять белок. Некоторые из них становятся химическими строительными блоками, которые могут создавать мышцы, рога или перья, другие могут стать гормонами или антителами. Многие образуют ферменты, которые управляют химическими реакциями жизни с поразительной точностью. Белки, которые находятся на поверхности клеток, функционируют как каналы связи между клеткой и тем, что ее окружает.
Вряд ли возможно переоценить потенциал, заключенный в химических строительных блоках жизни, этих 20 аминокислотах. Нобелевская премия по химии 2024 года посвящена их пониманию и освоению на совершенно новом уровне. Нобелевская премия по химии 2024 года присуждается за два разных открытия, но они тесно связаны.
Загадка: как белок находит свою уникальную структуру?
В 1962 году Джон Кендрю и Макс Перуц получили Нобелевскую премию по химии за создание первых трехмерных моделей белков с помощью рентгеновской кристаллографии.
Впоследствии ученые этим методом получили изображения около 200 000 различных белков, что заложило основу для Нобелевской премии по химии 2024 года. В 1972 Кристиан Анфинсен стал лауреатом премии за открытие о том, что трехмерная структура белка полностью определяется последовательностью аминокислот в белке.
Однако даже если белок состоит всего из 100 аминокислот, в теории он может принимать по крайней мере 1047 различных вариантов формы. Если бы цепочка аминокислот складывалась случайным образом, то потребовалось бы больше времени, чем возраст Вселенной, чтобы найти правильную структуру. В клетке это занимает всего несколько миллисекунд. Так как же на самом деле сворачивается цепочка аминокислот?
Эти выводы породили одну из величайших проблем биохимии: проблему предсказания. Задача состояла в том, чтобы предсказать структуры белков на основе известных последовательностей аминокислот.
ИИ на службе тайн природы
Прорыв произошел только в 2018 году, когда в эту область вошел мастер шахмат, эксперт по нейробиологии и искусственному интеллекту, один из создателей компании DeepMind Демис Хассабис. Он и его сотрудник Джон Джампер совместно руководили работой, которая фундаментально реформировала модель ИИ.
Алгоритм AlphaFold2 построили на новом типе сетей, называемых «трансформаторами». Они могут находить закономерности в огромных объемах данных более гибким образом, чем раньше, и эффективно определять, на чем следует сосредоточиться для достижения определенной цели. AlphaFold2 обучили на обширной информации из баз данных всех известных структур белков и последовательностей аминокислот. В итоге она показала себя почти так же хорошо, как рентгеновская кристаллография, что было поразительно.
Когда AlphaFold2 подтвердила, что действительно работает, ее создатели рассчитали структуру всех человеческих белков. Затем предсказали структуру практически всех 200 миллионов белков, которые известны сейчас во всех организмах Земли. Google DeepMind сделала код AlphaFold2 общедоступным.
Раньше на получение структуры белка часто уходили годы, если это вообще удавалось. Теперь это можно сделать за несколько минут. Модель ИИ не идеальна, но она сама оценивает правильность созданной ею структуры, поэтому исследователи знают, насколько надежен прогноз.
Путь от обратного
Третий лауреат этого года Дэвид Бейкер создал свое программное обеспечение для изучения структуры белков Rosetta. Однако вместо введения последовательности аминокислот и попыток предсказания структуры белков, как делали все, ученый вводид желаемую модель белка и получал предложения о ее аминокислотной последовательности. Это позволило бы создавать совершенно новые белки. Спектр природных белков ограничен. Чтобы получать белки с совершенно новыми функциями, исследовательская группа Бейкера должна была создать их с нуля.
Как сказал сам Бейкер, «если вы хотите построить самолет, вы не начинаете с модификации птицы; вместо этого вы понимаете основные принципы аэродинамики и строите летательные аппараты на основе этих принципов».
Ученые нарисовали белок с совершенно новой структурой, а затем заставили Rosetta вычислить, какой тип аминокислотной последовательности может привести к желаемому. Для этого Rosetta провела поиск в базе данных всех известных структур белков и нашла короткие фрагменты, которые имели сходство с фрагментами желаемой структурой.
Затем ученые ввели ген для предложенной аминокислотной последовательности в бактерии, которые производили желаемый белок. После структуру определили белка с помощью рентгеновской кристаллографии. Белок, который разработали исследователи, Top7, имел почти точно такую же структуру, которую спроектировали заранее. Уникальная структура Top7 не существовала в природе.
Код Rosetta опубликовали в открытом доступе, поэтому мировое исследовательское сообщество продолжило разработку программного обеспечения.
Что теперь?
Удивительная универсальность белков как химических инструментов отражается в огромном разнообразии жизни. То, что мы теперь можем так легко визуализировать структуру этих маленьких молекулярных машин, ошеломляет; это позволяет лучше понять, как функционирует жизнь, в том числе, почему развиваются некоторые болезни, как возникает устойчивость к антибиотикам или почему некоторые микробы могут разлагать пластик.
Способность создавать белки с новыми функциями, столь же поразительна. Это может привести к появлению новых наноматериалов, целевых фармацевтических препаратов, более быстрой разработке вакцин, минимальных датчиков и более экологичной химической промышленности и т.д.