Предсказание вторичной структуры белка

Мои таблетки

Предсказание структуры белка, моделирование структуры белка [1] , protein structure prediction – это направление молекулярного моделирования [2] ( in silico [3] , с применением вычислительной техники) пространственной (вторичной, третичной или четвертичной) структуры белка, по его аминокислотной последовательности (первичной структуре).

Предсказание структуры белков существенно отличается от проблемы дизайна белка [4] .

Предсказания структуры белков используются в генетической инженерии белков, благодаря которой уже сегодня получены новые третичные структуры [5] . Более сложной вычислительной задачей является предсказание межмолекулярных взаимодействий, таких как предсказание белок-белковых взаимодействий и молекулярная стыковка.

Предсказание структуры белков сегодня является одной из важнейших целей современной биоинформатики [6] и теоретической химии и применяется в биотехнологии (при создании новых ферментов [7] ) и в медицине (в фармацевтике). Результативность развития методов предсказания оценивается в рамах всемирного эксперимента CASP [8] , промежуточные итого которого подводятся один раз в два года, начиная с 1994 года.

В 1960-х годах американский биохимик Кристиан Анфинсен [9] предложил термодинамическую гипотезу, согласно которой атомы молекул белка, в естественных условиях, заключаются в термодинамически стабильную конформацию [10] , что соответствует минимуму свободной энергии системы. Иными словами, белок принимает определенную пространственную форму в результате ограничений, диктуемых композицией и физико-химическими свойствами аминокислот [11] , его формирующих.

В свою очередь, белковые молекулы со схожей пространственной структурой обычно играют схожую биологическую роль в процессах клеточного уровня. Таким образом, структура белка может рассматриваться в качестве промежуточного звена между химическим составом (первичной структурой) и функцией белка.

Структура белка.

Большинство аминокислотных последовательностей белков сегодня получают методом трансляции генов из нуклеотидных последовательностей ДНК [12] , которые определяются широкомасштабными исследовательскими проектами – такими, например, как проект «Геном человека» [13] .

Вместе с тем, методы экспериментального определения структуры белка технологически сложны, дороги и значительно (более чем на два порядка) отстают в производительности от методов определения химического состава. По состоянию на март 2010 года, в публичных базах данных были депонированы почти 10000000 последовательностей белков, и это количество продолжает увеличиваться стремительными темпами, при том, что усилиями крупных мировых центров структуральной генетики, централизованную базу данных структур белков PDB [14] удалось наполнить только 60000 структурами. Предполагается, что заполнить пробел между количеством последовательностей и структур белков можно исключительно методом теоретического предсказания структуры белков.

Решение данной проблемы означает открытие широких возможностей для внедрения и совершенствования самых различных биотехнологий (сегодня компьютерное предсказание структуры белка используется в биологии и медицине, в частности при разработке лекарств).

Знание структуры белка может подсказать потенциальных партнеров для белковой взаимодействия и, тем самым, подтолкнуть исследователей к разработке или совершенствованию новых антител [15] , объяснить фенотип [16] проведенных мутаций, косвенно, помочь в определении места для проведения мутаций с целью изменения определенных фенотипов.

Методы предсказания структуры белков

Предсказания структуры белков является сложной задачей по многим причинам:

  • Во-первых, количество возможных пространственных конфигураций белков достаточно велико,
  • Во-вторых, физические основы структурообразования белков и их стабильности еще не до конца изучены.

Для достижения успеха в построении модели для предсказания структуры белка, изначально должна быть разработана стратегия эффективного перестроения пространства возможных структур и выбора наиболее вероятных кандидатов на нативную структуру [17] .

Сегодня существуют два основных, концептуально различных метода сужения пространства поиска структурных конформаций белков:

  1. информационные методы, основанные на знаниях, полученных из экспериментально определенных структур (Knowledge-based methods),
  2. методы, основанные на основных принципах молекулярной динамики (modeling from the first principles / Ab initio [18] modeling).

Методы предсказания первого типа используют предположение, что искомая структура белка может быть похожей на одну или нескольких известных структур белков, или, по крайней мере, быть составлена из элементарных конструкционных блоков таких белков.

Читайте также:  Эдгар кейси предсказания pdf

Методы предсказания второго типа не используют информацию об известных структурах, базируясь преимущественно на упрощенных энергетических потенциалах, используя для моделирования приближенные стратегии поиска минимума энергетического ландшафта.

Предсказания структуры белка по образцу (шаблону)

Если среди известных структур белка удается найти такие, для которых можно предположить, что они могут быть, в определенной степени, схожи с объектом моделирования (предсказания), значит их можно использовать в качестве шаблона (образца) для построения модели. Данный метод гомологического моделирования называется «предсказание структуры белка по образцу (по шаблону») (Template-based modeling).

Шаблоны (образцы) предсказания могут быть найдены с помощью методов непосредственного сравнения аминокислотных последовательностей (Comparative modeling methods), BLAST [19] , FASTA [20] или более комплексных методов для распознавания структурно схожих белков при слабом или практически невыявленном сходстве последовательностей (fold recognition / threading methods).

Последняя группа методов основана на том принципе, что структура является эволюционно консервативной, в отличие от последовательности, и, иногда, возможно найти родственные белки с непохожими последовательностями, а потом попытаться «проследить» последовательность искомого белка через структуру шаблона. Теоретически, подобные белки можно выявить, сконструировав и сравнив профили последовательности искомого белка и известных структур.

Предсказание структуры белка по образцу (шаблону) имеет огромный практический потенциал, так как если известна структура хотя бы одного белка семьи, значит можно попробовать построить модели для практически каждого белка в данной семье. С наполнением базы данных структур, данное моделирование становится возможным для всё большего количества белков.

Бесшаблонное методы предсказания структуры белков

Если найти шаблон для предсказания структуры белка одним из вышеупомянутых методов не удается, в этой ситуации применяются бесшаблонные методы (Template-free / de novo methods). К бесшаблонным методам предсказания относятся фрагментные методы и чисто физические методы.

Бесшаблонное предсказание структуры белков методом молекулярной динамики с энергетической функцией (в частности, молекулярной динамики и метода Монте-Карло, с использованием преимущества распределенных и параллельных вычислений), учитывающей детали взаимодействия на атомном уровне, сегодня практически нереализуемо из-за высоких требований к вычислительным ресурсам. Именно по этой причине, большинство ab initio методов использует упрощенную атомную структуру белков.

Фолдинг небольших альфа-спиральных белковых доменов, например, белка виллина [21] был успешно предсказан in silico. Благодаря применению гибридных методов предсказания, сочетающих стандартную молекулярную динамику с квантовой механикой, было исследованы электронные состояния зрительного пигмента родопсина.

Бесшаблонные методы предсказания структуры белка являются менее надежными, нежели шаблонные, однако они позволяют сконструировать модели, имеющие общую форму (англ. – Fold), близкую к нативной структуре искомого белка.

Примечания

Примечания и пояснения к статье «Предсказание (моделирование) структуры белка».

  • [1]Белок, протеин, protein – высокомолекулярное органическое вещество, состоящее из альфа-аминокислот, объединенных пептидными связями (образующимися, когда аминогруппа одной аминокислоты и карбоксильная группа другой аминокислоты реагируют с выделением молекулы воды). Существуют две класса белков: простой белок, при гидролизе распадающийся исключительно на аминокислоты, и сложный белок (холопротеин, протеид), содержащий простетическую группу (подкласс кофакторов), при гидролизе сложного белка, кроме аминокислот, освобождается небелковая часть или продукты ее распада. Белки-ферменты ускоряют (катализируют) протекание биохимических реакций, оказывая существенное влияние на процессы обмена веществ. Отдельные белки выполняют механические или структурные функции, образуя цитоскелет, сохраняющий форму клеток. Помимо прочего, белки играют ключевую роль в сигнальных системах клеток, при иммунном ответе и в клеточном цикле. Белки являются основой для создания мышечной ткани, клеток, тканей и органов у человека.
  • [2]Молекулярное моделирование, ММ, Molecular modelling – собирательное название методов исследования свойств и структуры молекул с использованием вычислительной техники и последующей визуализацией результатов, что, в итоге, обеспечивает их трехмерное представления при заданных в расчете условиях.
  • in silico«>[3]in silico – термин, обозначающий компьютерную симуляцию (моделирование) эксперимента, обычно биологического. Корни термина in silico ведут к терминам in vitro (в пробирке) и in vivo (в живом организме). in silicio буквально означает «в кремнии», символизируя, тем самым, кремний, как полупроводниковый материал, играющий важную роль в создании кремниевых микросхем, использующихся в производстве компьютерной техники.
  • [4]Дизайн белка, protein design – рациональная конструкция новых белковых молекул, свернутых в целевой структуре белка, с целью проектирования его новых функций и / или поведения. Благодаря дизайну, белки могут быть разработаны как заново (новый белок), так и путем изменения уже существующих, на базе известной структуры белка и его последовательности (реконструкция).
  • [5]Третичная структура, трехмерная структура – пространственное строение (включая конформацию) всей молекулы белка, иной макромолекулы, состоящей из единственной цепи.
  • [6]Биоинформатика – совокупность подходов и методов, использующихся, в частности, в биофизике, биохимии, экологии, включающих в себя математические методы компьютерного анализа в сравнительной геномике, разработку программ и алгоритмов для предсказания пространственной структуры биополимеров, исследование стратегий, соответствующих вычислительных методологий, а также общее управление информационной сложности биологических систем. В биоинформатике используются методы прикладной математики, информатики и статистики.
  • [7]Ферменты, энзимы, enzymes – как правило, белковые молекулы или рибозимы (молекулы РНК) либо их комплексы, катализирующие (ускоряющие) химические реакции в живых системах. Ферменты, как и все белки, синтезируются в виде линейной цепочки аминокислот, сворачивающихся определенным образом. Каждая последовательность аминокислот сворачивается особым образом, в результате чего, получающаяся белковая глобула (молекула) обладает уникальными свойствами. Ферменты присутствуют во всех живых клетках и способствуют превращению одних веществ в другие. Ферментативная активность может регулироваться ингибиторами и активаторами (ингибиторы – понижают, активаторы – повышают). По типу катализируемых реакций ферменты подразделяются на шесть классов: оксидоредуктазы, трансферазы, гидролазы, лиазы, изомеразы и лигазы. Для осуществления катализа, отдельным ферментам необходимы компоненты небелковой природы – кофакторы. Кофакторы могут быть как неорганическими (железо-серные кластеры, ионы металлов, в том числе), так и органическими (гем, флавин, в том числе) молекулами. Органические кофакторы, прочно связанные с ферментом, называются простетическими группами. Кофакторы органической природы, способные отделяться от фермента, называют коферментами.
  • [8]Критическая оценка предсказания белковых структур, Critical Assessment of protein Structure Prediction, CASP – масштабный эксперимент по предсказанию белковых структур, считающийся всемирным соревнованием в науке структурного моделирования. Основной целью CASP является координация усилий в улучшении методов определения трехмерной структуры белков из их аминокислотных последовательностей. В рамках CASP происходит объективное тестирование методов предсказания белковых структур с последующей независимой оценкой структурного моделирования. В эксперименте, на постоянной основе, участвует свыше 100 исследовательских групп.
  • [9]Кристиан Бемер Анфинсен, Christian Boehmer Anfinsen (1916 – 1995 гг.) – американский биохимик, лауреат Нобелевский премии по химии 1972 года (совместно со Стэнфордом Муром и Уильямом Стайном), «за работу по установлению связи между аминокислотной последовательностью рибонуклеазы А и её биологически активной конформацией».
  • [10]Конформация – пространственное расположение атомов в молекуле определенной конфигурации, обусловленное поворотом вокруг одной или нескольких одинарных сигма-связей.
  • [11]Аминокислота – органическое соединения, являющееся строительным материалом для белковых структур, мышечных волокон. Организм использует аминокислоты для собственного роста, укрепления и восстановления, для выработки различных гормонов, ферментов и антител.
  • [12]Дезоксирибонуклеиновая кислота, ДНК, deoxyribonucleic acid, DNA – одна из трех основных макромолекул (две другие РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. ДНК хранит информацию о структуре различных видов РНК и белков. С химической точки зрения, ДНК представляет собой длинную полимерную молекулу, состоящую из повторяющихся блоков – нуклеотидов. Каждый нуклеотид состоит из азотистого основания (цитозин, тимин, гуанин и аденин), сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в цепи образуются за счет дезоксирибозы и фосфатной группы. В подавляющем большинстве случаев (за исключением отдельных вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух цепей, ориентированных азотистыми основаниями друг к другу. Цепи переплетены между собой в виде спирали, откуда и пошло название структуры молекулы ДНК – «двойная спираль».
  • [13]Проект «Геном человека», Проект Человеческий Геном, The Human Genome Project, HGP – международный научно-исследовательский проект, главной целью которого являлось определение последовательности нуклеотидов, составляющих ДНК, и идентификация 20—25 тысяч генов в человеческом геноме. Проект начался в 1990 году под эгидой Национальных институтов здравоохранения США, в 2000 году был выпущен рабочий черновик структуры генома, полный геном – в 2003 году. Основной объём секвенирования был выполнен в университетах и исследовательских центрах США, Великобритании и Канады.
  • [14]Protein Data Bank, PDB – банк данных 3-D структур белков и нуклеиновых кислот, полученных методами рентгеновской кристаллографии или ЯМР-спектроскопии. PDB является одним из важнейших ресурсов для ученых, работающих в области структурной биологии.
  • [15]Антитела, иммуноглобулины, ИГ, antibody, Ab, immunoglobulins, Ig, – класс сложных белков гликопротеинов, присутствующих в виде растворимых молекул в тканевой жидкости и в сыворотке крови, в виде мембраносвязанных рецепторов на поверхности B-лимфоцитов. Антитела способны крайне избирательно связываться с конкретными видами молекул (которые, в связи с чем называются антигенами). У человека выделяют пять классов антител (иммуноглобулинов), различающихся между собой по строению и аминокислотному составу тяжелых цепей и по выполняемым эффекторным функциям – IgG, IgA, IgM, IgD и IgE. Антитела являются важнейшим фактором специфического иммунитета, используются иммунной системой для идентификации и нейтрализации чужеродных объектов – вирусов и бактерий, в том числе.
  • [16]Фенотип (от греческих `6,^5,^3,_7,`9, – «обнаруживаю, являю» и `4,a3,`0,_9,`2, – «пример, образец, шаблон») – совокупность характеристик, присущих индивиду на определенной стадии развития (в результате онтогенеза). Фенотип формируется на базе генотипа, опосредованного рядом внешнесредовых факторов.
  • [17]Нативная структура – «естественная» структура, необходимая для функционирования в живой клетке. Нативная структура белка сохраняется благодаря нативному состоянию.
  • [18]Ab initio – обоснование какого-либо явления из естественных законов природы без привлечения дополнительных эмпирических предположений или специальных моделей.
  • [19]Basic Local Alignment Search Tool, BLAST – пакет компьютерных программ, предназначенных для поиска гомологов нуклеиновых кислот или белков, для которых известна последовательность (первичная структура) либо фрагмент. BLAST была разработана в рамках исследований, проводимых Национальными институтами здравоохранения США.
  • [20]FASTA – формат записи (текстовый) для нуклеотидных или полипептидных последовательностей, в котором аминокислоты или нуклеотиды обозначаются при помощи однобуквенных кодов. FASTA, содержащий названия последовательностей и сопутствующие комментарии, является наиболее популярным форматом представления генетических данных.
  • [21]Виллин – тканеспецифичный белок массой 92,5 кДа, связывающий актиновые филаменты щеточных каемок. Виллин содержит повторяющиеся гельзолин-подобные домены, увенчанные небольшой (8,5 кДа) «головкой» на C-конце, состоящей из быстро и независимо формирующихся трехспиральных последовательностей, стабилизированных гидрофобными взаимодействиями. Функции виллина до конца не изучены, однако предполагается, что он принимает участие в нуклеации, образовании, соединении в пучки и разрезании актиновых филаментов.
Читайте также:  Предсказание экспертами курса доллара

При написании статьи о структуре белка, а также о методах предсказания (моделирования) структуры белка, в качестве источников использовались материалы информационных и справочных интернет-порталов, сайтов новостей NCBI.NLM.NIH.gov, ProteinStructures.com, Stanford.edu, ScienceDaily.com, Genome.gov, FASTA.Bioch.Virginia.edu, FEN.NSU.ru, SGU.ru, VIGG.ru, Википедия, а также следующие печатные издания:

Жми и поделитесь статьей с друзьями:

Источник

Оцените статью