Структурная геномика - Structural genomics
Структурная геномика стремится описать 3-х мерная структура каждого белка, кодируемого данным геном. Этот подход, основанный на геноме, позволяет использовать высокопроизводительный метод определения структуры с помощью комбинации экспериментальный и модельный подходы. Принципиальная разница между структурной геномикой и традиционный структурный прогноз состоит в том, что структурная геномика пытается определить структуру каждого белка, кодируемого геномом, а не сосредотачиваться на одном конкретном белке. При наличии полногеномных последовательностей предсказание структуры может быть выполнено быстрее за счет комбинации экспериментального и модельного подходов, особенно потому, что наличие большого количества секвенированных геномов и ранее решенных белковых структур позволяет ученым моделировать структуру белка на структурах ранее решенных. гомологи.
Поскольку структура белка тесно связана с функцией белка, структурная геномика может дать информацию о функции белка. В дополнение к выяснению функций белков, структурная геномика может использоваться для определения новых белковых складок и потенциальных целей для открытия лекарств. Структурная геномика включает использование большого количества подходов к определению структуры, включая экспериментальные методы с использованием геномных последовательностей или подходы на основе моделирования, основанные на последовательности или структурная гомология к белку известной структуры или основанному на химических и физических принципах для белка, не имеющего гомологии с какой-либо известной структурой.
В отличие от традиционных структурная биология, определение структура белка через структурную геномику усилия часто (но не всегда) приходят раньше, чем что-либо известно о функции белка. Это ставит новые задачи в структурная биоинформатика, т.е. определение функции белка по его 3D структура.
Структурная геномика подчеркивает высокую производительность определения белковых структур. Это выполняется в специальных центры структурной геномики.
В то время как большинство структурных биологов исследуют структуры отдельных белков или групп белков, специалисты по структурной геномике исследуют структуры белков в масштабе всего генома. Это подразумевает крупномасштабное клонирование, экспрессию и очистку. Одно из главных преимуществ этого подхода - экономия на масштабе. С другой стороны, научная ценность некоторых результирующих структур иногда ставится под сомнение. А Наука В статье от января 2006 г. анализируется область структурной геномики.[1]
Одно из преимуществ структурной геномики, такое как Инициатива по структуре белка, заключается в том, что научное сообщество получает немедленный доступ к новым структурам, а также к таким реагентам, как клоны и белок. Недостатком является то, что многие из этих структур состоят из белков с неизвестной функцией и не имеют соответствующих публикаций. Это требует новых способов передачи этой структурной информации более широкому исследовательскому сообществу. Ядро Биоинформатики Объединенного центра структурной геномики (JCSG) недавно разработало подход на основе вики, а именно: Сеть аннотаций открытой структуры белка (TOPSAN) для аннотирования белковых структур, возникающих из высокопроизводительных центров структурной геномики.
Цели
Одна из целей структурной геномики - выявить новые белковые складки. Экспериментальные методы определения структуры белка требуют белков, которые хорошо экспрессируются и / или кристаллизуются, что может по своей природе смещать типы складок белков, проясняемые этими экспериментальными данными. Геномный подход, основанный на моделировании, такой как ab initio моделирование могут быть лучше способны идентифицировать новые белковые складки, чем экспериментальные подходы, потому что они не ограничены экспериментальными ограничениями.
Функция белка зависит от 3-D структуры, и эти 3-D структуры более консервативны, чем последовательности. Таким образом, высокопроизводительные методы определения структуры структурной геномики могут помочь нам в понимании функций белков. Это также имеет потенциальные последствия для открытия лекарств и белковой инженерии.[2] Более того, каждый белок, добавляемый в структурную базу данных, увеличивает вероятность того, что база данных будет включать гомологичные последовательности других неизвестных белков. В Инициатива по структуре белка (PSI) - это многогранная работа, финансируемая Национальные институты здоровья с различными академическими и промышленными партнерами, цель которых - расширить знания о структуре белка с использованием подхода структурной геномики и улучшить методологию определения структуры.
Методы
Структурная геномика использует преимущества завершенных последовательностей генома несколькими способами для определения белковых структур. Последовательность гена целевого белка также может быть сравнена с известной последовательностью, и структурная информация может быть затем выведена из известной структуры белка. Структурная геномика может использоваться для прогнозирования новых белковых складок на основе других структурных данных. Структурная геномика также может использовать подход, основанный на моделировании, который полагается на гомологию между неизвестным белком и решенной структурой белка.
de novo методы
Завершенные последовательности генома позволяют каждому открытая рамка чтения (ORF), часть гена, которая может содержать последовательность для информационная РНК и белок, который должен быть клонирован и выражен как белок. Затем эти белки очищаются и кристаллизуются, а затем подвергаются одному из двух типов определения структуры: Рентгеновская кристаллография и ядерный магнитный резонанс (ЯМР). Полная последовательность генома позволяет создать каждый праймер, необходимый для амплификации всех открытых рамок считывания, клонирования их в бактерии, а затем их экспрессии. Используя полногеномный подход к этому традиционному методу определения структуры белков, все белки, кодируемые геномом, могут быть экспрессированы одновременно. Этот подход позволяет определять структуру каждого белка, который кодируется геномом.
Методы на основе моделирования
ab initio моделирование
Этот подход использует данные о последовательности белков, а также химические и физические взаимодействия кодируемых аминокислот для прогнозирования трехмерных структур белков, не имеющих гомологии с решенными белковыми структурами. Один очень успешный метод для ab initio моделирование Розетта программа, которая делит белок на короткие сегменты и упорядочивает короткую полипептидную цепь в низкоэнергетическую локальную конформацию. Rosetta доступна для коммерческого и некоммерческого использования через публичную программу Robetta.
Последовательное моделирование
Этот метод моделирования сравнивает последовательность гена неизвестного белка с последовательностями белков с известной структурой. В зависимости от степени сходства между последовательностями структуру известного белка можно использовать в качестве модели для решения структуры неизвестного белка. Считается, что для высокоточного моделирования требуется не менее 50% идентичности аминокислотной последовательности неизвестного белка и решенной структуры. Идентичность последовательностей 30-50% дает модель со средней точностью, а идентичность последовательностей ниже 30% дает модели с низкой точностью. Было предсказано, что необходимо будет определить не менее 16000 белковых структур для того, чтобы все структурные мотивы были представлены хотя бы один раз и, таким образом, позволяя точно определить структуру любого неизвестного белка посредством моделирования.[3] Однако одним из недостатков этого метода является то, что структура более консервативна, чем последовательность, и поэтому моделирование на основе последовательностей может быть не самым точным способом прогнозирования структур белков.
Резьба
Резьба основывает структурное моделирование на сходстве складок, а не на идентичности последовательностей. Этот метод может помочь идентифицировать отдаленно связанные белки и может использоваться для определения молекулярных функций.
Примеры структурной геномики
В настоящее время предпринимается ряд попыток определить структуру каждого белка в данном протеоме.
Thermotogo maritima протеом
Одна текущая цель Объединенный центр структурной геномики (JCSG), часть Инициатива по структуре белка (PSI) - решить структуры всех белков в Thermotogo maritima, термофильная бактерия. T. maritima был выбран в качестве мишени для структурной геномики на основании его относительно небольшого генома, состоящего из 1877 генов, и гипотезы о том, что белки, экспрессируемые термофильной бактерией, будут легче кристаллизоваться.
Лесли и другие использовал кишечная палочка для выражения всех открытых рамок считывания (ORF) T. martima. Затем эти белки кристаллизовали, и с помощью рентгеновской кристаллографии определяли структуру успешно кристаллизованных белков. Среди других структур этот подход структурной геномики позволил определить структуру белка TM0449, который, как было обнаружено, демонстрирует новую складку, поскольку он не имеет структурной гомологии с каким-либо известным белком.[4]
Микобактерии туберкулеза протеом
Цель Консорциум структурной геномики ТБ заключается в определении структуры потенциальных мишеней для лекарств в Микобактерии туберкулеза, бактерия, вызывающая туберкулез. Разработка новых лекарственных препаратов против туберкулеза особенно важна с учетом растущей проблемы туберкулез с множественной лекарственной устойчивостью.
Полностью секвенированный геном М. туберкулез позволил ученым клонировать многие из этих белковых мишеней в векторы экспрессии для очистки и определения структуры с помощью рентгеновской кристаллографии. Исследования идентифицировали ряд белков-мишеней для определения структуры, включая внеклеточные белки, которые могут участвовать в патогенезе, белки, регулирующие железо, текущие мишени для лекарств и белки, которые, по прогнозам, имеют новые складки. К настоящему времени определены структуры 708 белков, кодируемых М. туберкулез.
Базы данных и классификации структуры белков
- Банк данных белков (PDB): репозиторий последовательности белков и структурной информации
- UniProt: предоставляет последовательность и функциональную информацию
- Структурная классификация белков (Классификации SCOP): иерархический подход
- Класс, архитектура, топология и гомологичное суперсемейство (CATH): иерархический подход
Смотрите также
Рекомендации
- ^ Чандония Дж. М., Бреннер С. Е. (январь 2006 г.). «Влияние структурной геномики: ожидания и результаты». Наука. 311 (5759): 347–51. Bibcode:2006Научный ... 311..347C. Дои:10.1126 / science.1121018. PMID 16424331. S2CID 800902.
- ^ Кун П., Уилсон К., Патч М.Г., Стивенс Р.К. (октябрь 2002 г.). «Генезис открытия высокопроизводительных лекарств на основе структуры с использованием кристаллографии белков». Curr Opin Chem Biol. 6 (5): 704–10. Дои:10.1016 / S1367-5931 (02) 00361-7. PMID 12413557.
- ^ Бейкер Д., Сали А. (октябрь 2001 г.). «Прогнозирование структуры белков и структурная геномика». Наука. 294 (5540): 93–6. Bibcode:2001Научный ... 294 ... 93B. Дои:10.1126 / science.1065659. PMID 11588250. S2CID 7193705.
- ^ Лесли С.А., Кун П., Годзик А. и др. (Сентябрь 2002 г.). «Структурная геномика протеома Thermotoga maritima, реализованная в высокопроизводительном конвейере определения структуры». Proc. Natl. Акад. Sci. СОЕДИНЕННЫЕ ШТАТЫ АМЕРИКИ. 99 (18): 11664–9. Bibcode:2002PNAS ... 9911664L. Дои:10.1073 / pnas.142413399. ЧВК 129326. PMID 12193646.
дальнейшее чтение
- Хофт Р.В., Вринд Дж., Сандер С., Абола Э.Е. (май 1996 г.). «Ошибки в белковых структурах». Природа. 381 (6580): 272. Bibcode:1996Натура.381..272H. Дои:10.1038 / 381272a0. PMID 8692262. S2CID 4368507.
- Марсден Р.Л., Льюис Т.А., Оренго, Калифорния (2007). «К всеобъемлющему структурному охвату завершенных геномов: взгляд на структурную геномику». BMC Bioinformatics. 8: 86. Дои:10.1186/1471-2105-8-86. ЧВК 1829165. PMID 17349043.
- Бейкер Э. Н., Аркус В. Л., Лотт Дж. С. (2003). «Прогнозирование и анализ структуры белка как инструмент функциональной геномики». Appl. Биоинформ. 2 (3 Прил.): S3–10. PMID 15130810.
- Гулдинг К.В., Перри Л.Дж., Андерсон Д. и др. (Сентябрь 2003 г.). «Структурная геномика Mycobacterium tuberculosis: предварительный отчет о прогрессе в UCLA». Биофиз. Chem. 105 (2–3): 361–70. CiteSeerX 10.1.1.318.7988. Дои:10.1016 / S0301-4622 (03) 00101-7. PMID 14499904.
- Сколник Дж., Фетроу Дж. С., Колински А. (март 2000 г.). «Структурная геномика и ее значение для анализа функций генов». Nat. Биотехнология. 18 (3): 283–7. Дои:10.1038/73723. PMID 10700142. S2CID 2723601.