Белковые тандемные повторы - Protein tandem repeats

Общие примеры структур белковых тандемных повторов: Повторяющийся домен WD40 из бета-TrCP (зеленый), богатый лейцином повторяющийся домен из TLR2 (красный), повторение домена броненосца из бета-катенин (синий), анкирин повторяющийся домен из ANKRA2 (оранжевый), кельч повторяющийся домен из Keap1 (желтый) и HEAT повторяющийся домен из PP2A регуляторная субъединица R1a (пурпурный).

Массив белок тандемные повторы определяются как несколько (не менее двух) соседних копий, имеющих одинаковые или похожие последовательность мотивов. Эти периодические последовательности генерируются внутренними дупликациями как в кодирующих, так и в некодирующих геномных последовательностях. Повторяющиеся единицы тандемных повторов белка значительно разнообразны, от повторения одной аминокислоты до доменов из 100 или более остатков.[1][2]

Схематическое изображение последовательности тандемного повтора.

«Повторяется» в белках

Пример множественного выравнивания последовательностей пентапептидный повтор приводит к тандемной повторяющейся структуре

В белки, "повтор" - это любой блок последовательности, который возвращается более одного раза в последовательность, либо в идентичной, либо в очень похожей форме. Степень сходства может сильно варьировать, при этом некоторые повторы сохраняют только несколько консервативных аминокислотных положений и характерную длину. Сильно вырожденные повторы очень трудно обнаружить по одной последовательности. Структурное сходство может помочь выявить повторяющиеся закономерности в последовательности.

Структура

Повторяемость сама по себе ничего не говорит о структуре белка. По «практическому правилу» короткие повторяющиеся последовательности (например, длиной менее 10 аминокислот) могут быть внутренне неупорядоченный, а не часть сложенный белковые домены. Повторы, которые имеют длину не менее 30-40 аминокислот, с гораздо большей вероятностью будут свернуты как часть домена. Такие длинные повторы часто указывают на присутствие в белке соленоидного домена.

Примерно половина областей тандемного повтора имеют внутренне неупорядоченный экстерьер естественно разворачивается.[3][4][5] Примеры неупорядоченных повторяющихся последовательностей включают 7-мерные пептидные повторы, обнаруженные в Субъединица RPB1 из РНК-полимераза II,[6] или тандем бета-катенин или аксин привязка линейные мотивы в APC (аденоматозный полипоз кишечной палочки).[7] Другая половина регионов со стабильным 3D структура имеет множество форм и функций.[8][9] Примеры коротких повторов, демонстрирующих упорядоченные структуры, включают три остатка коллагеновый повтор или пять остатков пентапептидный повтор что образует бета-спираль структура.

Классификация

В зависимости от длины повторяющихся единиц их белковые структуры можно разделить на пять классов:[8][9]

  1. кристаллические агрегаты, образованные участками с 1 или 2 длинными повторами остатка, архетипические регионы низкой сложности
  2. волокнистый структуры, стабилизированные межцепочечными взаимодействиями с повторами из 3-7 остатков
  3. удлиненный структуры с повторами из 5–40 остатков с преобладанием соленоидные белки
  4. закрыто (не удлиненные) структуры с повторами из 30-60 остатков в виде тороид повторяется
  5. бусы на нитке структуры с типичным размером повторов более 50 остатков, которые уже достаточно велики, чтобы независимо складываться в стабильные домены.

Функция

Некоторые хорошо известные примеры белков с тандемными повторами: коллаген, который играет ключевую роль в устройстве внеклеточного матрикса; альфа-спиральные спиральные катушки обладающие структурными функциями и функциями олигомеризации; богатый лейцином повтор белки, которые специфически связывают ряд глобулярных белков своими вогнутыми поверхностями; и протеины с цинковыми пальцами, которые регулируют экспрессию генов путем связывания ДНК.

Белки с тандемными повторами часто функционируют как модули белок-белкового взаимодействия. В WD40 повторить является ярким примером этой функции.[10]

Распределение в протеомах

Тандемные повторы повсеместны в протеомы и присутствуют как минимум в 14% всех белков.[11] Например, они присутствуют почти в каждом третьем белке человека и даже в каждом втором белке из Плазмодий falciparum или Dictyostelium discoideum.[11][12] Тандемные повторы с короткими повторяющимися единицами (особенно гомореповторы) встречаются чаще, чем другие.[11]

Аннотационные методы

Белковые тандемные повторы могут быть обнаружены либо по последовательности, либо аннотированы по структуре. Созданы специализированные методы идентификации повторяющихся белков. [13].

Стратегии, основанные на последовательностях, основанные на поиске гомологии [14] или присвоение домена [15] [16], в основном недооценивают TR из-за присутствия сильно вырожденных повторяющихся единиц [17]. Недавнее исследование для понимания и улучшения покрытия протеома человека Pfam [17] показали, что пять из десяти крупнейших кластеров последовательностей, не аннотированных Pfam, являются повторяющимися областями. В качестве альтернативы методы, не требующие предварительных знаний для обнаружения повторяющихся подстрок, могут быть основаны на самосравнении. [18] [19], кластеризация [20] [21] или скрытые марковские модели [22] [23]. Некоторые другие полагаются на измерения сложности [13] или воспользуйтесь мета-поиском, чтобы объединить результаты из разных источников [24] [25].

Вместо этого основанные на структуре методы используют преимущества модульности доступных структур PDB для распознавания повторяющихся элементов. [26] [27] [28] [29] [30].

использованная литература

  1. ^ Херинга Дж (июнь 1998 г.). «Обнаружение внутренних повторов: насколько они распространены?». Текущее мнение в структурной биологии. 8 (3): 338–45. Дои:10.1016 / s0959-440x (98) 80068-7. PMID  9666330.
  2. ^ Андраде М.А., Понтинг С.П., Гибсон Т.Дж., Борк П. (май 2000 г.). «Метод на основе гомологии для идентификации белковых повторов с использованием оценок статистической значимости». Журнал молекулярной биологии. 298 (3): 521–37. Дои:10.1006 / jmbi.2000.3684. PMID  10772867.
  3. ^ Tompa P (сентябрь 2003 г.). «Внутренне неструктурированные белки развиваются путем повторной экспансии». BioEssays. 25 (9): 847–55. Дои:10.1002 / bies.10324. PMID  12938174. S2CID  32684524.
  4. ^ Саймон М., Хэнкок Дж. М. (2009). «Тандемные и загадочные аминокислотные повторы накапливаются в неупорядоченных областях белков». Геномная биология. 10 (6): R59. Дои:10.1186 / gb-2009-10-6-r59. ЧВК  2718493. PMID  19486509.
  5. ^ Жорда Дж., Сюэ Б., Уверский В.Н., Каява А.В. (июнь 2010 г.). «Белковые тандемные повторы - чем совершеннее, тем менее структурированы» (PDF). Журнал FEBS. 277 (12): 2673–82. Дои:10.1111 / j.1742-4658.2010.07684.x. ЧВК  2928880. PMID  20553501.
  6. ^ Meyer PA, Ye P, Zhang M, Suh MH, Fu J (июнь 2006 г.). «Фазирование РНК-полимеразы II с использованием внутренне связанных атомов Zn: обновленная структурная модель». Структура. 14 (6): 973–82. Дои:10.1016 / j.str.2006.04.003. PMID  16765890.
  7. ^ Лю Дж, Син И, Хайндс Т. Р., Чжэн Дж, Сюй В. (июнь 2006 г.). «Третий повтор из 20 аминокислот - это самый плотный сайт связывания APC для бета-катенина». J. Mol. Биол. 360 (1): 133–44. Дои:10.1016 / j.jmb.2006.04.064. PMID  16753179.
  8. ^ а б Каява А.В. (сентябрь 2012 г.). «Тандемные повторы в белках: от последовательности к структуре». Журнал структурной биологии. 179 (3): 279–88. Дои:10.1016 / j.jsb.2011.08.009. PMID  21884799.
  9. ^ а б Паладин Л., Хирш Л., Пиовесан Д., Андраде-Наварро М.А., Каджава А.В., Тосатто СК (январь 2017 г.). «RepeatsDB 2.0: улучшенная аннотация, классификация, поиск и визуализация повторяющихся белковых структур». Исследования нуклеиновых кислот. 45 (D1): D308 – D312. Дои:10.1093 / нар / gkw1136. ЧВК  5210593. PMID  27899671.
  10. ^ Стирниманн К.Ю., Петсалаки Э., Рассел Р. Б., Мюллер К. В. (октябрь 2010 г.). «Белки WD40 продвигают клеточные сети». Тенденции в биохимических науках. 35 (10): 565–74. Дои:10.1016 / j.tibs.2010.04.003. PMID  20451393.
  11. ^ а б c Маркотт Э.М., Пеллегрини М., Йейтс Т.О., Айзенберг Д. (октябрь 1999 г.). «Перепись белковых повторов». Журнал молекулярной биологии. 293 (1): 151–60. Дои:10.1006 / jmbi.1999.3136. PMID  10512723.
  12. ^ Пеллегрини М (2015). «Тандемные повторы в белках: алгоритмы прогнозирования и биологическая роль». Границы биоинженерии и биотехнологии. 3: 143. Дои:10.3389 / fbioe.2015.00143. ЧВК  4585158. PMID  26442257.
  13. ^ а б Пеллегрини М, Ренда МЭ, Веккьо А (2012). «Ab initio обнаружение нечетких тандемных повторов аминокислот в белковых последовательностях». BMC Bioinformatics. 13 Дополнение 3: S8. Дои:10.1186 / 1471-2105-13-S3-S8. ЧВК  3402919. PMID  22536906.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  14. ^ Андраде М.А., Понтинг С.П., Гибсон Т.Дж., Борк П. (2000). «Основанный на гомологии метод идентификации белковых повторов с использованием оценок статистической значимости». Дж Мол Биол. 298 (3): 521–37. Дои:10.1006 / jmbi.2000.3684. PMID  10772867.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  15. ^ Эль-Гебали С., Мистри Дж., Бейтман А., Эдди С. Р., Лучани А., Поттер С. К.; и другие. (2019). «База данных семейств белков Pfam в 2019 году». Нуклеиновые кислоты Res. 47 (D1): D427 – D432. Дои:10.1093 / нар / gky995. ЧВК  6324024. PMID  30357350.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  16. ^ Митчелл А.Л., Аттвуд Т.К., Бэббит П.С., Блюм М., Борк П., Мост А; и другие. (2019). «InterPro в 2019 году: улучшение охвата, классификации и доступа к аннотациям последовательностей белков». Нуклеиновые кислоты Res. 47 (D1): D351 – D360. Дои:10.1093 / нар / gky1100. ЧВК  6323941. PMID  30398656.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  17. ^ а б Мистри Дж., Коггилл П., Эберхардт Р. Я., Дейана А., Джиансанти А., Финн Р. Д.; и другие. (2013). «Проблема увеличения охвата протеома человека Pfam». База данных (Оксфорд). 2013: bat023. Дои:10.1093 / база данных / bat023. ЧВК  3630804. PMID  23603847.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  18. ^ Хегер А., Холм Л. (2000). «Быстрое автоматическое обнаружение и выравнивание повторов в белковых последовательностях». Белки. 41 (2): 224–37. Дои:10.1002 / 1097-0134 (20001101) 41: 2 <224 :: aid-prot70> 3.0.co; 2-z. PMID  10966575.
  19. ^ Шкларчик Р., Херинга Дж. (2004). «Отслеживание повторов с использованием значимости и транзитивности». Биоинформатика. 20 Дополнение 1: i311-7. Дои:10.1093 / биоинформатика / bth911. PMID  15262814.
  20. ^ Ньюман А. М., Купер Дж. Б. (2007). «XSTREAM: практический алгоритм для идентификации и моделирования архитектуры тандемных повторов в белковых последовательностях». BMC Bioinformatics. 8: 382. Дои:10.1186/1471-2105-8-382. ЧВК  2233649. PMID  17931424.
  21. ^ Жорда Дж, Каява А.В. (2009). «T-REKS: идентификация тандемных повторов в последовательностях с помощью алгоритма на основе K-средних». Биоинформатика. 25 (20): 2632–8. Дои:10.1093 / биоинформатика / btp482. PMID  19671691.
  22. ^ Сёдинг Дж, Реммерт М, Бигерт А (2006). «HHrep: обнаружение повторов белка de novo и происхождение бочек TIM». Нуклеиновые кислоты Res. 34 (Проблема с веб-сервером): W137-42. Дои:10.1093 / нар / gkl130. ЧВК  1538828. PMID  16844977.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  23. ^ Бигерт А., Сёдинг Дж. (2008). «De novo идентификация сильно дивергированных белковых повторов по вероятностной последовательности». Биоинформатика. 24 (6): 807–14. Дои:10.1093 / биоинформатика / btn039. PMID  18245125.
  24. ^ Грубер М, Сёдинг Дж, Лупас А.Н. (2005). «REPPER - повторы и их периодичность в волокнистых белках». Нуклеиновые кислоты Res. 33 (Проблема с веб-сервером): W239-43. Дои:10.1093 / нар / gki405. ЧВК  1160166. PMID  15980460.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  25. ^ Шапер Э, Анисимова М (2015). «Эволюция и функция белковых тандемных повторов у растений». Новый Фитол. 206 (1): 397–410. Дои:10.1111 / nph.13184. PMID  25420631.
  26. ^ Абрахам А.Л., Роча Е.П., Потье Дж. (2008). «Swelfe: детектор внутренних повторов в последовательностях и структурах». Биоинформатика. 24 (13): 1536–7. Дои:10.1093 / биоинформатика / btn234. ЧВК  2718673. PMID  18487242.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  27. ^ Сабаринатан Р., Басу Р., Секар К. (2010). «ProSTRIP: метод поиска подобных структурных повторов в трехмерных белковых структурах». Comput Biol Chem. 34 (2): 126–30. Дои:10.1016 / j.compbiolchem.2010.03.006. PMID  20430700.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  28. ^ Уолш И., Сирокко Ф.Г., Минервини Дж., Ди Доменико Т., Феррари С, Тосатто СК (2012). «РАФАЭЛЬ: распознавание, периодичность и вставка соленоидных белковых структур». Биоинформатика. 28 (24): 3257–64. Дои:10.1093 / биоинформатика / bts550. PMID  22962341.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  29. ^ Грабе Т, Годзик А (2014). «ConSole: использование модульности карт контактов для определения местоположения соленоидных доменов в белковых структурах». BMC Bioinformatics. 15: 119. Дои:10.1186/1471-2105-15-119. ЧВК  4021314. PMID  24766872.
  30. ^ Do Viet P, Roche DB, Kajava AV (2015). «ТАПО: комбинированный метод идентификации тандемных повторов в белковых структурах». FEBS Lett. 589 (19 Pt A): 2611–9. Дои:10.1016 / j.febslet.2015.08.025. PMID  26320412. S2CID  28423787.CS1 maint: несколько имен: список авторов (ссылка на сайт)

внешние ссылки