“Това променя всичко”: Изкуствен интелект разгада как се нагъват протеините

“Това променя всичко”: Изкуствен интелект разгада как се нагъват протеините

SHARE

След като стана известна с успехите си в игри като шах и го, групата за изкуствен интелект DeepMind разреши сериозен научен проблем, който затруднява изследователите в продължение на половин век.

 

С най-новата си програма за изкуствен интелект, AlphaFold, компанията показа, че може да предскаже как протеините се сгъват в 3D форми – изключително сложен процес, който е основен за разбирането на биологичните механизми на живота.

 

Независими учени заявиха, че пробивът ще помогне на изследователите да разкрият механизмите, които причиняват някои болести, да проправи път за дизайнерски лекарства, подобрени земеделски култури и “зелени ензими”, които могат да разграждат пластмаса, пише в. “Гардиън”

 

DeepMind заяви, че е започнал работа с шепа научни групи и първоначално ще се фокусира върху маларията, сънната болест и лайшманиозата, паразитно заболяване.

“Това е вълнуващ момент, каза Демис Хасабис, основател и главен изпълнителен директор на DeepMind. Тези алгоритми вече стават достатъчно зрели и достатъчно мощни, за да бъдат приложими за наистина предизвикателни научни проблеми.”

 

Венки Рамакришнан, президент на Кралското общество на Великобритания, нарече работата “зашеметяващ напредък, настъпил десетилетия преди много хора в тази област да са очаквали”.

 

DeepMind е най-известна със своите програми, които постигнаха надмощие в шаха, го, Starcraft II и класически игри на Atari. Но свръхчовешкият геймплей никога не е бил основната цел на компанията – игрите предоставиха тренировъчна площадка за програми, които, след като са достатъчно мощни, ще бъдат използвани за реални проблеми.

Нагъването на протеини е голямо предизвикателство в биологията от близо 50 години и е трудно да се надцени неговото значение. Повечето биологични процеси зависят от протеините и формата на протеина определя неговата функция. Когато изследователите знаят как се сгъва протеинът, те могат да започнат да разкриват какво точно прави той. Как инсулинът контролира нивата на захар в кръвта и как антителата се борят с коронавируса се определят от протеиновата структура.

 

 

Учените са идентифицирали повече от 200 милиона протеина, но структурите са известни само за малка част от тях. До момента структурата се откриваше чрез щателна лабораторна работа, която може да отнеме години. И докато компютърните учени са постигнали напредък по проблема, изводът за структурата от състава на протеина не е лесна задача. Протеините са вериги от аминокиселини, които могат да се усукват и да се огъват в изумително разнообразие от форми – около гогол на куб, или 1, последвано от 300 нули.

 

Много заболявания са свързани с ролята на протеините в катализирането на химични реакции (ензими), борба с болести (антитела) или предаването на информация (хормони като инсулин).

 

 

“Дори малките пренареждания на тези жизненоважни молекули могат да имат катастрофални ефекти върху здравето ни, така че един от най-ефективните начини за разбиране на болестите и намиране на нови лечения е изследването на участващите протеини. Разработването на формата само на един изисква скъпо оборудване и може да отнеме години.”


Джон Моулт, биолог от Университета в Мериленд и председател на CASP

За да научат как се сгъват протеините, изследователите от DeepMind обучават своя алгоритъм в публична база данни, съдържаща около 170 000 протеинови последователности и техните форми. Работейки с еквивалента на 100 до 200 графични процесора – по съвременни стандарти сравнително малко количество изчислителна мощ – обучението отне няколко седмици.

 

DeepMind тества AlphaFold в “протеиновите олимпийски игри” CASP (Critical Assessment of Protein Structure Prediction). Участниците в международното състезание получават аминокиселинните последователности за около 100 протеина и са предизвикани да изработят тяхната структура. Резултатите от екипи, които използват компютри, се сравняват с тези, базирани на лабораторна работа.

 

Как работи предизвикателството?

 

През 1972 г. Кристиан Анфинсен получава Нобелова награда за работата си, показваща, че трябва да е възможно да се определи формата на протеините въз основа на последователността на техните аминокиселинни градивни блокове.

 

На всеки две години десетки екипи от над 20 страни се опитват да предскажат с помощта на компютри формата на набор от около 100 протеина от техните аминокиселинни последователности.

 

В същото време триизмерните структури се разработват в лабораторията от биолози, използвайки традиционни техники като рентгенова кристалография и ЯМР спектроскопия, които определят местоположението на всеки атом един спрямо друг в протеиновата молекула.

 

След това екип от учени от CASP сравнява тези прогнози с 3D структурите, получени с помощта на експериментални методи.

 

CASP използва метрика, известна като “глобален тест за отстояние”, за да оцени точността, варираща от 0 до 100. Резултат от около 90, който програмата AlphaFold на DeepMind постигна, се счита за сравним с лабораторните техники.

 

 

AlphaFold не само превъзхожда другите компютърни програми, но достига точност, сравнима с трудоемките и отнемащи време лабораторни методи. Когато се класира по всички анализирани протеини, AlphaFold има средна оценка 92.5 от 100. За най-трудните протеини средният резултат е спаднал, но незначително – до 87.

 

Хасабис казва, че DeepMind е започнала работа по това как да предостави на изследователите достъп до AlphaFold, за да помогне с научните изследвания. Андрей Лупас, директор на Института за развитие на биологията “Макс Планк” в Тюбинген, Германия, заяви пред списание Nature, че вече е използвал програмата за решаване на протеинова структура, върху която учените са се трудили в продължение на десетилетие.

 

“Това е промяна в играта”, казва Лупас, който очаква очаква AlphaFold да промени начина му на работа и въпросите, с които се занимава. “Това ще промени медицината. Това ще промени изследванията. Това ще промени биоинженерството. Това ще промени всичко”, добавя той.

 

Как ще се използва тази информация?

 

Познаването на триизмерната структура на протеина е важно за проектирането на лекарства и за разбирането на човешките заболявания, включително рак, деменция и инфекциозни заболявания.

 

Един пример е COVID-19, където учените изследват как протеиновият “шип” на повърхността на вируса Sars-CoV-2 взаимодейства с рецепторите в човешките клетки.

 

Учени ще искат да разгледат данните, за да определят колко точен е методът на DeepMind и колко добре се представя на различни нива.

 

Все още има пропуск в знанията, включително да се разбере как се образуват комплексни протеини и как протеините взаимодействат с други молекули като ДНК и РНК.

 

“Сега, когато проблемът е решен до голяма степен за единични протеини, е отворен пътят за разработване на нови методи за определяне на формата на протеиновите комплекси – групи от протеини, които работят заедно, за да формират голяма част от механизмите на живота, и за други приложения”, смята Андрей Криштафович от Университета на Калифорния в Дейвис и едни от съдиите на CASP.

SHARE
Смислен прочит на събитията, които имат значение.