Phyre - Phyre

Phyre2
Разработчики)
  • Лоуренс Келли
  • Боб Маккаллум
  • Бенджамин Джефферис
  • Алекс Герберт
  • Риккардо Беннетт-Ловси
  • Майкл Штернберг
Стабильный выпуск
2.0 / 23 февраля 2011 г.; 9 лет назад (2011-02-23)
Написано в
Доступно ванглийский
ТипБиоинформатика инструмент для предсказание структуры белка
ЛицензияCreative Commons Атрибуция-2.0
Интернет сайтwww.sbg.bio.IC.ac.Великобритания/ phyre2

Phyre и Phyre2 (пRotein ЧАСомология / АналогY рпознание Engine; произносится как «огонь») - это бесплатные веб-службы для предсказание структуры белка.[1][2][3] Phyre - один из самых популярных методов предсказания структуры белков, который цитировался более 1500 раз.[4] Как и другие методы распознавания удаленной гомологии (см. белковая нить ), он может регулярно создавать надежные модели белков, когда другие широко используемые методы, такие как PSI-BLAST не можешь. Phyre2 был разработан, чтобы обеспечить удобный интерфейс для пользователей, неопытных в методах прогнозирования структуры белков. Его разработка финансируется Совет по исследованиям биотехнологии и биологических наук.[5]

Описание

Серверы Phyre и Phyre2 предсказывают трехмерную структуру белковой последовательности, используя принципы и методы моделирование гомологии Поскольку структура белка более консервативна в эволюции, чем его аминокислотная последовательность, интересующая последовательность белка (мишень) может быть смоделирована с разумной точностью на очень отдаленной последовательности известной структуры (матрице), при условии, что отношения между целью и шаблоном можно определить через выравнивание последовательностей. В настоящее время самые мощные и точные методы обнаружения и выравнивания отдаленно связанных последовательностей основаны на профили или же скрытые марковские модели (HMMs). Эти профили / HMM отражают склонность к мутациям каждого положения в аминокислотной последовательности на основе наблюдаемых мутаций в родственных последовательностях и могут рассматриваться как «эволюционный отпечаток пальца» конкретного белка.

Обычно составляются аминокислотные последовательности репрезентативного набора всех известных трехмерных белковых структур, и эти последовательности обрабатываются путем сканирования по большой базе данных последовательностей белков. Результатом является база данных профилей или HMM, по одному для каждой известной трехмерной структуры. Последовательность пользователей, представляющих интерес, аналогичным образом обрабатывается для формирования профиля / HMM. Затем этот профиль пользователя сканируется по базе данных профилей с использованием методов выравнивания профиль-профиль или HMM-HMM. Эти выравнивания могут также учитывать шаблоны предсказанных или известных элементов вторичной структуры и могут быть оценены с использованием различных статистических моделей. Видеть предсказание структуры белка для дополнительной информации.

Первый сервер Phyre был выпущен в июне 2005 года и использует алгоритм выравнивания профиля-профиля на основе каждого белка. оценочная матрица для конкретной позиции.[6] Сервер Phyre2 был публично выпущен в феврале 2011 года в качестве замены исходного сервера Phyre и обеспечивает дополнительную функциональность по сравнению с Phyre, более продвинутый интерфейс, полностью обновленную библиотеку складывания и использует HHpred / HHsearch пакет для определения гомологии среди других улучшений.

Стандартное использование

После вставки аминокислотной последовательности белка в форму представления Phyre или Phyre2 пользователь обычно будет ждать от 30 минут до нескольких часов (в зависимости от таких факторов, как длина последовательности, количество гомологичных последовательностей, частота и длина вставок и удалений) для предсказание для завершения. Электронное письмо, содержащее сводную информацию и прогнозируемую структуру в Формат PDB отправляются пользователю вместе со ссылкой на веб-страницу результатов. Экран результатов Phyre2 разделен на три основных раздела, описанных ниже.

Вторичная структура и прогноз беспорядков

Пример вывода Phyre2 для предсказания вторичной структуры и беспорядка

Представленная пользователем последовательность белка сначала сканируется по большой базе данных последовательностей с использованием PSI-BLAST. Профиль, созданный с помощью PSI-BLAST, затем обрабатывается программой прогнозирования вторичной структуры нейронной сети PsiPred.[7] и предсказатель белкового расстройства Disopred.[8] Предполагаемое присутствие альфа-спиралей, бета-цепей и неупорядоченных областей показано графически вместе с цветной шкалой достоверности.

Анализ домена

Пример вывода Phyre2, показывающий несколько доменов и всплывающее окно просмотра модели

Многие белки содержат несколько белковые домены. Phyre2 предоставляет таблицу совпадений шаблонов с цветовой кодировкой по достоверности и указанием области совпадающей пользовательской последовательности. Это может помочь в определении доменного состава белка.

Подробная информация о шаблоне

Пример таблицы с подробной информацией о шаблоне Phyre2

Основная таблица результатов в Phyre2 предоставляет оценки достоверности, изображения и ссылки на трехмерные предсказанные модели и информацию, полученную из любого База данных структурной классификации белков (SCOP) или Банк данных белков (PDB) в зависимости от источника обнаруженного шаблона. Для каждого совпадения ссылка приводит пользователя к подробному просмотру соответствия между пользовательской последовательностью и последовательностью известной трехмерной структуры.

Просмотр выравнивания

Пример Phyre2 - подробный вид выравнивания между пользовательской последовательностью и известной структурой белка.

Подробное представление совмещения позволяет пользователю исследовать отдельные выровненные остатки, совпадения между предсказанными и известными элементами вторичной структуры и возможность переключать информацию, касающуюся паттернов сохранения последовательности и достоверности вторичной структуры. Кроме того Jmol используется для интерактивного трехмерного просмотра модели белка.

Улучшения в Phyre2

Phyre2 использует библиотеку складок, которая обновляется еженедельно по мере создания новых структур. Он использует более современный интерфейс и предлагает дополнительные функции по сравнению с сервером Phyre, как описано ниже.

Дополнительная функциональность

Пакетная обработка

Функция пакетной обработки позволяет пользователям отправлять более одной последовательности в Phyre2, загружая файл последовательностей в Формат FASTA. По умолчанию у пользователей есть ограничение в 100 последовательностей в пакете. Этот предел можно увеличить, обратившись к администратору. Пакетные задания обрабатываются в фоновом режиме на свободных вычислительных мощностях, когда они становятся доступными. Таким образом, пакетные задания часто занимают больше времени, чем индивидуально отправленные задания, но это необходимо для справедливого распределения вычислительных ресурсов среди всех пользователей Phyre2.

Один к одному потоку

Один к одному потоку позволяет вам загружать как последовательность, которую вы хотите смоделировать, так и шаблон, на котором она будет моделироваться. Иногда у пользователей есть белковая последовательность, которую они хотят смоделировать на конкретном шаблоне по своему выбору. Это может быть, например, недавно решенная структура, которой нет в базе данных Phyre2, или из-за некоторой дополнительной биологической информации, которая указывает на то, что выбранный шаблон будет производить более точную модель, чем модель (ы), автоматически выбранная Phyre2.

Backphyre

Вместо того, чтобы предсказывать трехмерную структуру белковой последовательности, пользователи часто имеют решенную структуру, и они заинтересованы в определении наличия связанной структуры в интересующем геноме. В Phyre2 загруженная структура белка может быть преобразована в скрытую марковскую модель, а затем сканирована по набору геномов (более 20 геномов по состоянию на март 2011 г.). Эта функция называется «BackPhyre», чтобы указать, как Phyre2 используется в обратном порядке.

Phyrealarm

Иногда Phyre2 не может обнаружить никаких достоверных совпадений с известными структурами. Однако база данных кратной библиотеки увеличивается примерно на 40-100 новых структур каждую неделю. Так что, даже если на этой неделе может не быть подходящих шаблонов, они вполне могут появиться в ближайшие недели. PHYrealarm позволяет пользователям отправлять последовательность белков для автоматического сканирования на предмет новых записей, добавляемых в библиотеку складок каждую неделю. Если обнаружено уверенное попадание, пользователь автоматически получает уведомление по электронной почте вместе с результатами поиска Phyre2. Пользователи также могут контролировать уровень покрытия выравнивания и уверенность в совпадении, необходимое для запуска оповещения по электронной почте.

3DLigandSite

Phyre2 связан с 3DLigandSite[9] сервер для предсказания сайтов связывания белков. 3DLigandSite был одним из самых эффективных серверов для прогнозирования сайта привязки на Критическая оценка методов прогнозирования структуры белка (CASP) в (CASP 8 и CASP 9). Уверенные модели, созданные Phyre2 (достоверность> 90%), автоматически отправляются в 3DLigandSite.

Прогноз трансмембранной топологии

Программа memsat_svm[10] используется для прогнозирования наличия и топологии любых трансмембранных спиралей, присутствующих в последовательности белка пользователя.

Мультишаблонное моделирование

Phyre2 позволяет пользователям выбирать «Интенсивное» моделирование на главном экране отправки. Этот режим:

  • Исследует список совпадений и применяет эвристические методы для выбора шаблонов, которые обеспечивают максимальное покрытие последовательности и надежность.
  • Строит модели для каждого выбранного шаблона.
  • Использует эти модели для обеспечения попарных ограничений расстояния, которые вводятся в ab initio и инструмент моделирования с несколькими шаблонами Poing.[11]
  • Поинг синтезирует пользовательский белок в контексте этих ограничений расстояния, моделируемых пружинами. Регионы, для которых нет информации о шаблоне, моделируются ab initio упрощенная физическая модель Поинга.
  • Полная модель, созданная Poing, объединяется с исходными шаблонами в качестве входных данных для МОДЕЛЛЕР.

Приложения

Приложения Phyre и Phyre2 включают предсказание структуры белков, предсказание функций, предсказание доменов, предсказание границ доменов, эволюционную классификацию белков, руководство сайт-направленный мутагенез и решение кристаллических структур белка с помощью молекулярная замена.

Есть два связанных ресурса, которые используют предсказания Файра для структурного анализа пропущенных вариантов, которые обычно возникают в результате однонуклеотидные полиморфизмы.

  • PhyreRisk представляет собой базу данных, которая отображает генетические варианты в экспериментальные и предсказанные Файром белковые структуры. На странице белков отображаются экспериментальные и прогнозируемые структуры. Пользователи могут отображать варианты по генетическим или белковым координатам.[12]
  • Missense3D представляет собой инструмент, который предоставляет стереохимический отчет о влиянии миссенс-варианта на структуру белка. Пользователи могут загружать свои собственные варианты и координаты, включая как структуры PDB, так и модели, предсказанные Файром.[13]

История

Phyre и Phyre2 являются преемниками 3D-PSSM[14] система предсказания структуры белков, на которую на сегодняшний день цитировано более 1400 ссылок.[15] 3D-PSSM был разработан и разработан Лоуренсом Келли.[16] и Боб МакКаллум[17] в Лаборатории биомолекулярного моделирования[18] на Cancer Research UK. Файр и Файр2 были Лоуренсом Келли в Структурная биоинформатика группа,[19] Имперский колледж Лондон. Компоненты систем Phyre и Phyre2 были разработаны Бенджамином Джефферисом,[20] Алекс Герберт,[21] и Риккардо Беннетт-Ловси.[22] Исследования и разработки обоих серверов контролировались Майкл Штернберг.

Рекомендации

  1. ^ Лоуренс Келли; Риккардо Беннетт-Ловси; Алекс Герберт; Киран Флеминг. "Phyre: механизм распознавания гомологии белков / аналогий". Группа структурной биоинформатики, Имперский колледж, Лондон. Получено 22 апреля 2011.
  2. ^ Лоуренс Келли; Бенджамин Джефферис. "Phyre2: Гомология белков / механизм распознавания аналогий, версия 2.0". Группа структурной биоинформатики, Имперский колледж, Лондон. Получено 22 апреля 2011.
  3. ^ Kelley, L.A .; Штернберг, М. Дж. Э. (2009). "Прогнозирование структуры белка в Интернете: пример использования сервера Phyre" (PDF). Протоколы природы. 4 (3): 363–71. Дои:10.1038 / nprot.2009.2. HDL:10044/1/18157. PMID  19247286. S2CID  12497300.
  4. ^ Количество результатов, полученных при поиске в Google Scholar (Поиск Google Scholar)
  5. ^ "Справка: о PHYRE2". Сервер распознавания складок PHYRE Protein Fold. Работа по разработке веб-сервера Phyre2 поддерживается грантом BBSRC по инструментам и ресурсам.
  6. ^ Bennett-Lovsey, R.M .; Герберт, А.Д .; Sternberg, M. J. E .; Келли, Л. А. (2007). «Изучение крайностей пространства последовательностей / структур с распознаванием ансамблевых складок в программе Phyre». Белки: структура, функции и биоинформатика. 70 (3): 611–25. Дои:10.1002 / prot.21688. PMID  17876813. S2CID  23530683.
  7. ^ McGuffin, L.J .; Bryson, K .; Джонс, Д. Т. (2000). «Сервер прогнозирования структуры белка PSIPRED». Биоинформатика. 16 (4): 404–5. Дои:10.1093 / биоинформатика / 16.4.404. PMID  10869041.
  8. ^ Джонс, Д. Т .; Уорд, Дж. Дж. (2003). «Прогнозирование неупорядоченных областей в белках на основе матриц оценок положения». Белки: структура, функции и генетика. 53: 573–8. Дои:10.1002 / prot.10528. PMID  14579348. S2CID  6081008.
  9. ^ Wass, M. N .; Kelley, L.A .; Штернберг, М. Дж. Э. (2010). «3DLigand» Сайт: Прогнозирование сайтов связывания лиганда с использованием подобных структур ». Исследования нуклеиновых кислот. 38 (Проблема с веб-сервером): W469 – W473. Дои:10.1093 / nar / gkq406. ЧВК  2896164. PMID  20513649.
  10. ^ Джонс, Д. Т. (2007). «Повышение точности прогноза топологии трансмембранного белка с использованием информации об эволюции». Биоинформатика. 23 (5): 538–44. Дои:10.1093 / биоинформатика / btl677. PMID  17237066.
  11. ^ Jefferys, B.R .; Kelley, L.A .; Штернберг, М. Дж. Э. (2010). «Сворачивание белков требует контроля толпы в моделируемой клетке». Журнал молекулярной биологии. 397 (5): 1329–38. Дои:10.1016 / j.jmb.2010.01.074. ЧВК  2891488. PMID  20149797.
  12. ^ Ofoegbu, Tochukwu C .; Дэвид, Алессия; Келли, Лоуренс А .; Мезулис, Стефанс; Islam, Suhail A .; Mersmann, Sophia F .; Стрёмих, Леони; Ваксер, Илья А .; Хоулстон, Ричард С .; Штернберг, Майкл Дж. Э. (2019). "PhyreRisk: динамическое веб-приложение для объединения геномики, протеомики и трехмерных структурных данных для руководства интерпретацией генетических вариантов человека". Журнал молекулярной биологии. 431 (13): 2460–2466. Дои:10.1016 / j.jmb.2019.04.043. ISSN  0022-2836. ЧВК  6597944. PMID  31075275.
  13. ^ Иттисопонписан, Сиравит; Islam, Suhail A .; Ханна, Тарун; Альхузими, Эман; Дэвид, Алессия; Штернберг, Майкл Дж. Э. (2019). «Могут ли предсказанные трехмерные структуры белка дать надежное представление о том, связаны ли несмысленные варианты с заболеванием?». Журнал молекулярной биологии. 431 (11): 2197–2212. Дои:10.1016 / j.jmb.2019.04.009. ISSN  0022-2836. ЧВК  6544567. PMID  30995449.
  14. ^ Kelley, L.A .; MacCallum, R.M .; Штернберг, М. Дж. Э. (2000). «Расширенная аннотация генома с использованием структурных профилей в программе 3D-PSSM». Журнал молекулярной биологии. 299 (2): 501–522. Дои:10.1006 / jmbi.2000.3741. PMID  10860755.
  15. ^ Количество результатов, полученных в результате поиска в Академии Google. (Поиск Google Scholar)
  16. ^ Доктор Лоуренс Келли
  17. ^ Доктор Боб Маккаллум
  18. ^ «Лаборатория биомолекулярного моделирования». Архивировано из оригинал на 2011-09-29. Получено 2011-03-09.
  19. ^ Группа структурной биоинформатики
  20. ^ "Доктор Бенджамин Джефферис". Архивировано из оригинал на 2011-04-18. Получено 2011-03-28.
  21. ^ Доктор Алекс Герберт[постоянная мертвая ссылка ]
  22. ^ Доктор Риккардо Беннетт-Ловси