РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ ДЛЯ МОДЕЛИРОВАНИЯ БЕЛКОВЫХ СТРУКТУР В ФАРМАЦИИ И МЕДИЦИНЕ
РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ ДЛЯ МОДЕЛИРОВАНИЯ БЕЛКОВЫХ СТРУКТУР В ФАРМАЦИИ И МЕДИЦИНЕ
Обзор
Чиряпкин А.С.1, *, Глушко А.А.2, Чиряпкин В.С.3, Гендугов Т.А.4.
1 ORCID: 0000-0001-8207-2953;
2 ORCID: 0000-0001-7465-5657;
3 ORCID: 0000-0003-4807-591X;
4 ORCID: 0000-0002-7447-8328;
1, 2, 3, 4 Пятигорский медико-фармацевтический институт – филиал федерального государственного бюджетного образовательного учреждения высшего образования «Волгоградский государственный медицинский университет» Министерства здравоохранения Российской Федерации, Пятигорск, Россия
* Корреспондирующий автор (alexey.chiriapkin[at]yandex.ru)
АннотацияВ данной статье рассматриваются современные достижения в области компьютерного моделирования различных биологических систем на уровне белковых структур с помощью распределительных вычислительных систем (на примере суперкомпьютеров и грид-вычислительных систем). К каждому примеру или группе схожих примеров в конце повествования прилагаются возможные направления их применения в области медицины и фармации. Таким образом у читателя формируется целостное представление о приведенных моделируемых биосистем от начального этапа исследования до дальнейшего найденного или ещё только прогнозируемого практического применения полученных результатов на практике.
Ключевые слова: компьютерное моделирование, суперкомпьютер, грид-вычислительная система, достижение, применение, фармация, медицина, белки.
DISTRIBUTED COMPUTING SYSTEMS FOR MODELING PROTEIN STRUCTURES IN PHARMACY AND MEDICINE
Research article
Chiriapkin A.S.1, *, Glushko A.A.2, Chiriapkin V.S.3, Gendugov T.A4.
1 ORCID: 0000-0001-8207-2953;
2 ORCID: 0000-0001-7465-5657;
3 ORCID: 0000-0003-4807-591X;
4 ORCID: 0000-0002-7447-8328;
1, 2, 3, 4 Pyatigorsk Medical and Pharmaceutical Institute – a branch of the Volgograd State Medical University, a federal state budgetary educational institution of higher education of the Ministry of Health of the Russian Federation,
Pyatigorsk, Russia
* Corresponding author (alexey.chiriapkin[at]yandex.ru)
AbstractThis article discusses modern advances in computer modeling of various biological systems at the level of protein structures with the use of distributed computing systems (for example, supercomputers and grid computing systems). At each example or a group of similar examples at the end of the narrative, possible directions for their application in the field of medicine and pharmacy are attached. Thus, a reader forms a holistic view of the given simulated biosystems from the initial stage of the study to the further found or even predicted practical application of the results obtained in practice.
Keywords: computer simulation, supercomputer, grid computing system, achievement, application, pharmacy, medicine, proteins.
Белки представляют собой высокомолекулярные органические соединения. Они состоят из соединенных между собой с помощью пептидной связью альфа-аминокислот. Белки в организме человека выполняют различные функции, например, выступают в качестве строительного материала в клетке, участвуют в переносе различных веществ в организме, из белков состоят иммуноглобулины [1]. Подробное изучение механизмов пространственной организации белковых молекул является важным элементом в разъяснении принципов работы различных биологических систем организма. Для создания целенаправленного фармакологического действия на интересующие белковые мишени исследователям необходимо детальное знание их структуры и функционирования.
До сих пор точно не известен механизм процесса самоорганизации белковых молекул, называемый фолдингом. Остаётся не до конца понятным, как вновь синтезированный в организме белок в доли секунды приобретает необходимую для выполнения своих биологических функций пространственную конформацию. Сворачивание белков на данный момент – это большая неразрешенная научная проблема современного мира [2]. Сегодняшние методы анализа не всегда справляются с задачей точного определения пространственной структуры исследуемого белка. В частности, затруднительно проанализировать структуру белков, которые образуют сложные межмолекулярные комплексы, или же произвести исследование интегральных белков клеточных мембран.
Сейчас посредством компьютерного моделирования ученые занимаются изучением физико-химических аспектов фолдинга белков. Это довольно трудоемкий и длительный научный процесс [3]. Существует два основных подхода реализации компьютерного моделирования белковых структур: с помощью суперкомпьютеров или путем использования грид-вычислений.
Суперкомпьютер – это вычислительная машина, которая обладает значительно более высокой производительность по сравнению с обычными компьютерами. Такой суперкомпьютер состоит из большого числа соединенных между собой высокоскоростной сетью вычислительных узлов. Главным преимуществом суперкомпьютеров является их высокое быстродействие, позволяющее проводить в относительно короткие сроки масштабные вычислительные задачи. К минусам суперкомпьютеров можно отнести их сложную архитектуру, сложность организации рационального процесса охлаждения, высокую стоимость создания суперкомпьютера. Сейчас суперкомпьютеры активно используются в ходе решения различных исследовательских задач. Например, такие суперкомпьютеры, как Summit – IBM (США), Sunway TaihuLight – NCRPC (Китай), AI Bridging Cloud Infrastructure – Fujitsu (Япония) и Sierra – IBM (США).
Так, например, в 2010 году на суперкомпьютере Anton (созданным частной компанией D. E. Shaw Research для изучения научных вопросов моделирования белков) осуществили впервые миллисекундное моделирование фолдинга небольших белков методом молекулярной динамики. В данном вычислительном эксперименте ученые смогли на атомном уровне детально отследить все стадии процесса преобразования полипептидной цепи в альфа-спирали и бета-структуры. Полученные результаты эксперимента отлично согласуются с данными спектроскопии [4].
Отечественным лидером среди суперкомпьютеров является Ломоносов-2, который установлен в Московском государственном университете имени М.В. Ломоносова. На данном суперкомпьютере реализуются различные исследовательские проекты, например, моделирование молекулярных процессов в клетке [5].
Грид-вычислительная система – это набор соединенных между собой удаленных компьютеров посредством специальных программ и каналов связи. При таком подходе происходит перераспределение вычислительного процесса между всеми отдельными компьютерами, которые участвуют в вычислении. Важным преимуществом грид-системы является возможность организации вычислительного процесса между удаленными компьютерами, при этом быстродействие системы определяется не только возможностями компьютера, но и скорости передачи данных в сети интернет. Грид-система обладает высокой надежностью, так как выход из строя нескольких узлов не прервет вычислительный процесс, а также данная поломка несущественно снижает производительность. Стоит отметить, что в случае грид-системы возможно использование огромного количества компьютером, что создают возможности наращивания вычислительной производимости системы. К недостаткам грид-системы можно отнести проблемы совместимости программного обеспечения, сбои коммуникационной сети, сложность сохранения конфиденциальности выполняемой задачи [6]. Наибольшую известность среди грид-систем, занимающихся моделированием белковых структур, получили проекты Folding@home и Rosetta@home.
В октябре 2000 года ученые из Стэнфордского университета запустили проект Folding@home, который занимается моделированием свертывания белков. Проект Folding@home основан на способе распределенных вычислений. Суть такого метода компьютерных исследований направлена на решение нехватки производственных мощностей путем объединения множества компьютеров в одну вычислительную систему. В проекте может участвовать любой желающий человек. Для этого достаточно загрузить и установить на свой компьютер специальную программу-клиент, которая будет подключаться к серверу и перераспределять вычислительные задачи. Целью проекта Folding@home является изучение механизмов образования дефектных белков посредством моделирования процессов их свертывания. Дефектные белки лежат в основе многих заболеваний человека, таких как болезни Альцгеймера, диабета II типа, различных форм онкологических заболеваний. Благодаря высокой вычислительной мощности этого проекта ученым удается моделировать фолдинг белковых молекул на протяжении долей секунды, что является довольно большим временным отрезком моделирования на сегодняшний день. Так в 2010 году группе учёных из Стэнфорда удалось преодолеть миллисекундный барьер, что представляло собой проблему в научном мире в течение многих лет. В данном исследовании проводилось моделирование сворачивания белка субъединицы рибосомы NTL9, который участвует, например, в регуляции процессов старения у растений [7]. В своей работе ученые показали один из наиболее вероятных путей сворачивания одной макромолекулы их белков большой субъединицы рибосомы NTL9. [8]. Созданная в ходе исследования учеными методика может быть успешно использована для моделирования свертывания высокоорганизованных белков, в том числе участвующих в возникновении патологических состояний организма человека.
Одним из направлений исследований проекта Folding@home является изучение белков шаперонов. Многие виды шаперонов являются белком теплового шока, который начинает запускаться в биохимические процессы организма в условиях клеточного стресса, например, в случае локального или общего повышение температуры тела. Таким образом шапероны нормализуют аномальный фолдинг белков в условиях температурного стресса. Быстро растущие раковые клетки зачастую вовлекают в свой процесс метаболизма специфические шапероны. Пути блокирования активности таких шаперонов рассматриваются в качестве новых мишений для перспективных противонкологических лекарственных препаратов Проект Folding@home тесно сотрудничает с Центром по изучениях механизмов фолдинга в Pande Lab Стэнфорского университета Ученые совместно проводят компьютерные исследования искусственно модифицированных шаперонов. Изучается влияние таких структурных единиц на конечную конформационную форму, синтезируемых в организме человека дефектных белков. При этом важно избежать появление неблагоприятных побочных эффектов, которые могут возникать у макроорганизма в ответ на блокирование не только аномальных шаперонов. Целью данной научной работы является поиск лекарственного вещества, способного избирательно блокировать активность специфических шаперонов раковой клетки [9], [10].
Folding@home занимается изучением других белковых структур, которые принимают участие в формировании онкологических заболеваниях. В 2012 году проект Folding@home помог Chris Garcia Lab с открытием нового подтипа интерлейкина-2 (ИЛ-2), который в 300 раз более эффективен в иммунных процессах человека, чем естественный его аналог. В частности, ИЛ-2 помогает Т-клеткам иммунной системы атаковать опухолевые новообразования, тем самым приводя к гибели дефектных клеток. Противоопухолевая активность измененной формы ИЛ-2 была подтверждена экспериментально на животных. Национальный институт здравоохранения США проводит тестирования активности данной измененной молекулы ИЛ-2 в отношение различных видов опухолей. В ближайшее время, в случае успешных дальнейших клинических испытаний данного иммунного белка, возможно будет ожидать появление на фармацевтическом рынке нового противоопухолевого препарата [11].
Существует проект Rosetta@home, который, как и проект Folding@home, основан на методе распределенных вычислений и занимается компьютерным изучением пространственной структуры белка в зависимости от его аминокислотной последовательности. Первый релиз проекта состоялся в 2005 году. Разработчиками Rosetta@home являются сотрудники Baker laboratory, расположенной в Вашингтонском университете. Одними из направлений научных исследований Rosetta@home является изучение таких болезней, как малярия, сибирская язва, болезнь Альцгеймера, онкологические заболевания [12]. В 2016 году на основе данных, полученных в ходе компьютерных вычислений проекта Rosetta@home, был предложен дизайн сверхстабильного белкового икосаэдра, который состоял из 60 белковых субъединиц. Икосаэдр является самым крупным из платоновых белковых тел, участвующих в упаковке и транспортировки, например, структурных элементов вирусных частиц [13]. Икосаэдр был сформирован из 60 белковых блоков, данные о аминокислотной последовательности которых были получены учеными из базы данных Protein Data Bank. На способность образовывать нужную геометрическую форму исследовалось порядка 300 различных белков. Анализ возможности проведения необходимой белковой сборки проводился научными сотрудниками в программе Symmetric RosettaDesign. В дальнейшем гены, которые отвечают за синтез необходимых белков для сборки икосаэдров, были введены в геном клетки кишечной палочки посредством плазмид. Синтезированные кишечными палочками белковые блоки были помещены в специальный раствор, где осуществлялась их самосборка в икосаэдры. Затем методом электронной микроскопии проводилось исследование полученных икосаэдров. Анализ показал, что были получены белковые частицы с необходимой геометрической формой размером 14 нм. В конечном итоге экспериментальные данные подтвердили правильность результатов виртуального моделирования самосборки белковых икосаэдров [14]. Возможность получения таких белковых икосаэдров позволяет в дальнейшем конструировать специальные белковые контейнеры с интересующими учеными физиологическими свойствами. Такие белковые контейнеры можно будет использовать для адресной доставки лекарственных средств при лечении конкретного заболевания [15], также белковые икосаэдры могут найти применение в создании вакцин [16] и в синтетической биологии [17].
Многообразие белковых молекул и их систем в организме огромно. Предсказание трехмерной структуры белка, особенно крупных молекул, на основе его первичной структуры является важным этапом развития биологических наук. В частности, изучение механизмов формирования и функционирования белков поможет разобраться ученым в механизмах возникновения и течения многих заболеваний человека, а также в поиске и создании новых перспективных лекарственных средств.
Конфликт интересов Не указан. | Conflict of Interest None declared. |
Список литературы/ References
- Попов Е.М. Проблема белка. Том 3: Структурная организация белка / Е. М. Попов. – М.: Наука. – 604 с.
- Dill K.A. The protein folding problem: when will it be solved? / Dill K.A., Ozka, S.B., Weikl T.R. // Opinion in Structural Biology. 2007. V. 17. P. 342-346. doi: 1016/j.sbi.2007.06.001.
- Rizzuti B. Using simulations to provide the framework for experimental protein folding studies / Rizzuti B., Daggett V // Archives of Biochemistry and Biophysics. 2013. V. 531. P. 128–135. doi: 1016/j.abb.2012.12.015.
- ShawE. Atomic-Level Characterization of the Structural Dynamics of Proteins / Shaw D.E., Maragakis P., Lindorff-Larsen K. and others // Science. 2010. No. 330. P. 341-346.
- Суперкомпьютер Ломоносов-2 [Электронный ресурс] URL:https://www.t-platforms.ru/inception/projects/superkompyuter-lomonosov-2/ (дата обращения: 5.03.2019)
- What is grid computing? [Electronic resource] URL: https://www.e-sciencecity.org/EN/gridcafe/what-is-the-grid.html/ (accessed: 1.03.2019).
- Block A. The Pseudomonas syringae type III effector HopD1 suppresses effector-triggered immunity, localizes to the endoplasmic reticulum, and targets the Arabidopsis transcription factor NTL9 / Block A., Toru T.Y., Elowsky C.G. and others // New Phytol. 2014. V. 201. P. 1358–1370. doi: 1111/nph.12626.
- Voelz V.A. Molecular Simulation of ab Initio Protein Folding for a Millisecond Folder NTL9(1−39) Voelz V.A., Bowman G.R., Beauchamp K. // J. Am. Chem. Soc. 2010. V. 132. P. 1526–1528. doi: 10.1021/ja9090353.
- Шевцов М.А. Применение белков теплового шока в клинической онкологии / Шевцов М.А., Хачатрян В.А, Маргулис Б.А. // Современная онкология. 2012. Т. 14. С. 63-68.
- Almeida M.B. Molecular chaperones: toward new therapeutic tools / Almeida M.B., Nascimento J.L., Herculano A.M., and others // Journal of Molecular Biology. 2011. V. 65. P. 239–243.
- Levin A.M. Exploiting a natural conformational switch to engineer an interleukin-2 'superkine / Levin A.M., Bates D.L., Ring A.M. and others // Nature. 2012. V. 484. P. 529–533. doi: 10.1038/nature10975.
- Rosetta@home - Protein Folding [Electronic resource] URL: http://boinc.bakerlab.org/rosetta/ (accessed: 9.03.2018)
- Zandi R. Origin of icosahedral symmetry in viruses / Zandi R., Reguera D., Bruinsma R.F. and others // Proc. Natl Acad. Sci. USA. 2004. V. 101. P. 15556–15560. doi: 1073/pnas.0405844101.
- Hsia Y. Design of a hyperstable 60-subunit protein icosahedron / Hsia Y., Bale J.B., Gonen S. and others // Nature. 2016. V. 535. P. 136 -139. doi:1038/nature18010.
- Ma Y. Virus-based nanocarriers for drug delivery / Ma Y., Nolte R.J., Cornelissen J.J. // Adv Drug Deliv Rev. V. 64. P. 811-825. doi: 10.1016/j.addr.2012.01.005.
- Smith M.L. Modified Tobacco mosaic virus particles as scaffolds for display of protein antigens for vaccine applications / Smith M.L., Lindb J.A., Dillard-Telm S. and others // Virology. 2006. V. 348. P. 475–488. doi: 1016/j.virol.2005.12.039.
- Bauler P. Channeling by Proximity: The Catalytic Advantages of Active Site Colocalization Using Brownian Dynamics / Bauler P., Huber G., Leyh T., and others // J. Phys. Chem. Lett. 2010. V. 1. P. 1332–1335. doi: 10.1021/jz1002007.
Список литературы на английском языке / References in English
- Popov E.M. Problema belka. Tom 3: Strukturnaya organizaciya belka [The problem of protein. Volume 3: Structural organization of protein] / E. M. Popov. – M.: Nauka. – 604 s. [in Russian].
- Dill K.A. The protein folding problem: when will it be solved? / Dill K.A., Ozka, S.B., Weikl T.R. // Opinion in Structural Biology. 2007. V. 17. P. 342-346. doi: 1016/j.sbi.2007.06.001.
- Rizzuti B. Using simulations to provide the framework for experimental protein folding studies / Rizzuti B., Daggett V // Archives of Biochemistry and Biophysics. 2013. V. 531. P. 128–135. doi: 1016/j.abb.2012.12.015.
- Shaw D.E. Atomic-Level Characterization of the Structural Dynamics of Proteins / Shaw D.E., Maragakis P., Lindorff-Larsen K. and others // Science. 2010. No. 330. P. 341-346.
- Superkomp'yuter Lomonosov-2 [Supercomputer Lomonosov-2] Electronic resource] - URL: https://www.t-platforms.ru/inception/projects/superkompyuter-lomonosov-2/ (accessed: 5.03.2019). [in Russian].
- What is grid computing? [Electronic resource] URL: https://www.e-sciencecity.org/EN/gridcafe/what-is-the-grid.html/ (accessed: 1.03.2019).
- Block A. The Pseudomonas syringae type III effector HopD1 suppresses effector-triggered immunity, localizes to the endoplasmic reticulum, and targets the Arabidopsis transcription factor NTL9 / Block A., Toru T.Y., Elowsky C.G. and others // New Phytol. 2014. V. 201. P. 1358–1370. doi: 1111/nph.12626.
- Voelz V.A. Molecular Simulation of ab Initio Protein Folding for a Millisecond Folder NTL9(1−39) Voelz V.A., Bowman G.R., Beauchamp K. // J. Am. Chem. Soc. 2010. V. 132. P. 1526–1528. doi: 10.1021/ja9090353.
- Shevcov M.A. Primenenie belkov teplovogo shoka v klinicheskoj onkologii [Application of heat shock proteins in clinical Oncology] / Shevcov M.A., Hachatryan V.A, Margulis B.A. // Sovremennaya onkologiya. 2012. T. 14. S. 63-68. [in Russian].
- Almeida M.B. Molecular chaperones: toward new therapeutic tools / Almeida M.B., Nascimento J.L., Herculano A.M. and others // Journal of Molecular Biology. 2011. V. 65. P. 239–243.
- Levin A.M. Exploiting a natural conformational switch to engineer an interleukin-2 'superkine / Levin A.M., Bates D.L., Ring A.M. and others // Nature. 2012. V. 484. P. 529–533. doi: 10.1038/nature10975.
- Rosetta@home - Protein Folding [Electronic resource] URL: http://boinc.bakerlab.org/rosetta/ (accessed: 9.03.2018)
- Zandi R. Origin of icosahedral symmetry in viruses / Zandi R., Reguera D., Bruinsma R.F. and others // Proc. Natl Acad. Sci. USA. 2004. V. 101. P. 15556–15560. doi: 1073/pnas.0405844101.
- Hsia Y. Design of a hyperstable 60-subunit protein icosahedron / Hsia Y., Bale J.B., Gonen S. and others // Nature. 2016. V. 535. P. 136 -139. doi:1038/nature18010.
- Ma Y. Virus-based nanocarriers for drug delivery / Ma Y., Nolte R.J., Cornelissen J.J. // Adv Drug Deliv Rev. V. 64. P. 811-825. doi: 10.1016/j.addr.2012.01.005.
- Smith M.L. Modified Tobacco mosaic virus particles as scaffolds for display of protein antigens for vaccine applications / Smith M.L., Lindb J.A., Dillard-Telm S. and others // Virology. 2006. V. 348. P. 475–488. doi: 1016/j.virol.2005.12.039.
- Bauler P. Channeling by Proximity: The Catalytic Advantages of Active Site Colocalization Using Brownian Dynamics / Bauler P., Huber G., Leyh T., and others // J. Phys. Chem. Lett. 2010. V. 1. P. 1332–1335. doi: 10.1021/jz1002007.