Белковые тандемные повторы - Protein tandem repeats
Массив белок тандемные повторы определяются как несколько (не менее двух) соседних копий, имеющих одинаковые или похожие последовательность мотивов. Эти периодические последовательности генерируются внутренними дупликациями как в кодирующих, так и в некодирующих геномных последовательностях. Повторяющиеся единицы тандемных повторов белка значительно разнообразны, от повторения одной аминокислоты до доменов из 100 или более остатков.[1][2]
«Повторяется» в белках
В белки, "повтор" - это любой блок последовательности, который возвращается более одного раза в последовательность, либо в идентичной, либо в очень похожей форме. Степень сходства может сильно варьировать, при этом некоторые повторы сохраняют только несколько консервативных аминокислотных положений и характерную длину. Сильно вырожденные повторы очень трудно обнаружить по одной последовательности. Структурное сходство может помочь выявить повторяющиеся закономерности в последовательности.
Структура
Повторяемость сама по себе ничего не говорит о структуре белка. По «практическому правилу» короткие повторяющиеся последовательности (например, длиной менее 10 аминокислот) могут быть внутренне неупорядоченный, а не часть сложенный белковые домены. Повторы, которые имеют длину не менее 30-40 аминокислот, с гораздо большей вероятностью будут свернуты как часть домена. Такие длинные повторы часто указывают на присутствие в белке соленоидного домена.
Примерно половина областей тандемного повтора имеют внутренне неупорядоченный экстерьер естественно разворачивается.[3][4][5] Примеры неупорядоченных повторяющихся последовательностей включают 7-мерные пептидные повторы, обнаруженные в Субъединица RPB1 из РНК-полимераза II,[6] или тандем бета-катенин или аксин привязка линейные мотивы в APC (аденоматозный полипоз кишечной палочки).[7] Другая половина регионов со стабильным 3D структура имеет множество форм и функций.[8][9] Примеры коротких повторов, демонстрирующих упорядоченные структуры, включают три остатка коллагеновый повтор или пять остатков пентапептидный повтор что образует бета-спираль структура.
Классификация
В зависимости от длины повторяющихся единиц их белковые структуры можно разделить на пять классов:[8][9]
- кристаллические агрегаты, образованные участками с 1 или 2 длинными повторами остатка, архетипические регионы низкой сложности
- волокнистый структуры, стабилизированные межцепочечными взаимодействиями с повторами из 3-7 остатков
- удлиненный структуры с повторами из 5–40 остатков с преобладанием соленоидные белки
- закрыто (не удлиненные) структуры с повторами из 30-60 остатков в виде тороид повторяется
- бусы на нитке структуры с типичным размером повторов более 50 остатков, которые уже достаточно велики, чтобы независимо складываться в стабильные домены.
Функция
Некоторые хорошо известные примеры белков с тандемными повторами: коллаген, который играет ключевую роль в устройстве внеклеточного матрикса; альфа-спиральные спиральные катушки обладающие структурными функциями и функциями олигомеризации; богатый лейцином повтор белки, которые специфически связывают ряд глобулярных белков своими вогнутыми поверхностями; и протеины с цинковыми пальцами, которые регулируют экспрессию генов путем связывания ДНК.
Белки с тандемными повторами часто функционируют как модули белок-белкового взаимодействия. В WD40 повторить является ярким примером этой функции.[10]
Распределение в протеомах
Тандемные повторы повсеместны в протеомы и присутствуют как минимум в 14% всех белков.[11] Например, они присутствуют почти в каждом третьем белке человека и даже в каждом втором белке из Плазмодий falciparum или Dictyostelium discoideum.[11][12] Тандемные повторы с короткими повторяющимися единицами (особенно гомореповторы) встречаются чаще, чем другие.[11]
Аннотационные методы
Белковые тандемные повторы могут быть обнаружены либо по последовательности, либо аннотированы по структуре. Созданы специализированные методы идентификации повторяющихся белков. [13].
Стратегии, основанные на последовательностях, основанные на поиске гомологии [14] или присвоение домена [15] [16], в основном недооценивают TR из-за присутствия сильно вырожденных повторяющихся единиц [17]. Недавнее исследование для понимания и улучшения покрытия протеома человека Pfam [17] показали, что пять из десяти крупнейших кластеров последовательностей, не аннотированных Pfam, являются повторяющимися областями. В качестве альтернативы методы, не требующие предварительных знаний для обнаружения повторяющихся подстрок, могут быть основаны на самосравнении. [18] [19], кластеризация [20] [21] или скрытые марковские модели [22] [23]. Некоторые другие полагаются на измерения сложности [13] или воспользуйтесь мета-поиском, чтобы объединить результаты из разных источников [24] [25].
Вместо этого основанные на структуре методы используют преимущества модульности доступных структур PDB для распознавания повторяющихся элементов. [26] [27] [28] [29] [30].
использованная литература
- ^ Херинга Дж (июнь 1998 г.). «Обнаружение внутренних повторов: насколько они распространены?». Текущее мнение в структурной биологии. 8 (3): 338–45. Дои:10.1016 / s0959-440x (98) 80068-7. PMID 9666330.
- ^ Андраде М.А., Понтинг С.П., Гибсон Т.Дж., Борк П. (май 2000 г.). «Метод на основе гомологии для идентификации белковых повторов с использованием оценок статистической значимости». Журнал молекулярной биологии. 298 (3): 521–37. Дои:10.1006 / jmbi.2000.3684. PMID 10772867.
- ^ Tompa P (сентябрь 2003 г.). «Внутренне неструктурированные белки развиваются путем повторной экспансии». BioEssays. 25 (9): 847–55. Дои:10.1002 / bies.10324. PMID 12938174. S2CID 32684524.
- ^ Саймон М., Хэнкок Дж. М. (2009). «Тандемные и загадочные аминокислотные повторы накапливаются в неупорядоченных областях белков». Геномная биология. 10 (6): R59. Дои:10.1186 / gb-2009-10-6-r59. ЧВК 2718493. PMID 19486509.
- ^ Жорда Дж., Сюэ Б., Уверский В.Н., Каява А.В. (июнь 2010 г.). «Белковые тандемные повторы - чем совершеннее, тем менее структурированы» (PDF). Журнал FEBS. 277 (12): 2673–82. Дои:10.1111 / j.1742-4658.2010.07684.x. ЧВК 2928880. PMID 20553501.
- ^ Meyer PA, Ye P, Zhang M, Suh MH, Fu J (июнь 2006 г.). «Фазирование РНК-полимеразы II с использованием внутренне связанных атомов Zn: обновленная структурная модель». Структура. 14 (6): 973–82. Дои:10.1016 / j.str.2006.04.003. PMID 16765890.
- ^ Лю Дж, Син И, Хайндс Т. Р., Чжэн Дж, Сюй В. (июнь 2006 г.). «Третий повтор из 20 аминокислот - это самый плотный сайт связывания APC для бета-катенина». J. Mol. Биол. 360 (1): 133–44. Дои:10.1016 / j.jmb.2006.04.064. PMID 16753179.
- ^ а б Каява А.В. (сентябрь 2012 г.). «Тандемные повторы в белках: от последовательности к структуре». Журнал структурной биологии. 179 (3): 279–88. Дои:10.1016 / j.jsb.2011.08.009. PMID 21884799.
- ^ а б Паладин Л., Хирш Л., Пиовесан Д., Андраде-Наварро М.А., Каджава А.В., Тосатто СК (январь 2017 г.). «RepeatsDB 2.0: улучшенная аннотация, классификация, поиск и визуализация повторяющихся белковых структур». Исследования нуклеиновых кислот. 45 (D1): D308 – D312. Дои:10.1093 / нар / gkw1136. ЧВК 5210593. PMID 27899671.
- ^ Стирниманн К.Ю., Петсалаки Э., Рассел Р. Б., Мюллер К. В. (октябрь 2010 г.). «Белки WD40 продвигают клеточные сети». Тенденции в биохимических науках. 35 (10): 565–74. Дои:10.1016 / j.tibs.2010.04.003. PMID 20451393.
- ^ а б c Маркотт Э.М., Пеллегрини М., Йейтс Т.О., Айзенберг Д. (октябрь 1999 г.). «Перепись белковых повторов». Журнал молекулярной биологии. 293 (1): 151–60. Дои:10.1006 / jmbi.1999.3136. PMID 10512723.
- ^ Пеллегрини М (2015). «Тандемные повторы в белках: алгоритмы прогнозирования и биологическая роль». Границы биоинженерии и биотехнологии. 3: 143. Дои:10.3389 / fbioe.2015.00143. ЧВК 4585158. PMID 26442257.
- ^ а б Пеллегрини М, Ренда МЭ, Веккьо А (2012). «Ab initio обнаружение нечетких тандемных повторов аминокислот в белковых последовательностях». BMC Bioinformatics. 13 Дополнение 3: S8. Дои:10.1186 / 1471-2105-13-S3-S8. ЧВК 3402919. PMID 22536906.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Андраде М.А., Понтинг С.П., Гибсон Т.Дж., Борк П. (2000). «Основанный на гомологии метод идентификации белковых повторов с использованием оценок статистической значимости». Дж Мол Биол. 298 (3): 521–37. Дои:10.1006 / jmbi.2000.3684. PMID 10772867.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Эль-Гебали С., Мистри Дж., Бейтман А., Эдди С. Р., Лучани А., Поттер С. К.; и другие. (2019). «База данных семейств белков Pfam в 2019 году». Нуклеиновые кислоты Res. 47 (D1): D427 – D432. Дои:10.1093 / нар / gky995. ЧВК 6324024. PMID 30357350.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Митчелл А.Л., Аттвуд Т.К., Бэббит П.С., Блюм М., Борк П., Мост А; и другие. (2019). «InterPro в 2019 году: улучшение охвата, классификации и доступа к аннотациям последовательностей белков». Нуклеиновые кислоты Res. 47 (D1): D351 – D360. Дои:10.1093 / нар / gky1100. ЧВК 6323941. PMID 30398656.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ а б Мистри Дж., Коггилл П., Эберхардт Р. Я., Дейана А., Джиансанти А., Финн Р. Д.; и другие. (2013). «Проблема увеличения охвата протеома человека Pfam». База данных (Оксфорд). 2013: bat023. Дои:10.1093 / база данных / bat023. ЧВК 3630804. PMID 23603847.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Хегер А., Холм Л. (2000). «Быстрое автоматическое обнаружение и выравнивание повторов в белковых последовательностях». Белки. 41 (2): 224–37. Дои:10.1002 / 1097-0134 (20001101) 41: 2 <224 :: aid-prot70> 3.0.co; 2-z. PMID 10966575.
- ^ Шкларчик Р., Херинга Дж. (2004). «Отслеживание повторов с использованием значимости и транзитивности». Биоинформатика. 20 Дополнение 1: i311-7. Дои:10.1093 / биоинформатика / bth911. PMID 15262814.
- ^ Ньюман А. М., Купер Дж. Б. (2007). «XSTREAM: практический алгоритм для идентификации и моделирования архитектуры тандемных повторов в белковых последовательностях». BMC Bioinformatics. 8: 382. Дои:10.1186/1471-2105-8-382. ЧВК 2233649. PMID 17931424.
- ^ Жорда Дж, Каява А.В. (2009). «T-REKS: идентификация тандемных повторов в последовательностях с помощью алгоритма на основе K-средних». Биоинформатика. 25 (20): 2632–8. Дои:10.1093 / биоинформатика / btp482. PMID 19671691.
- ^ Сёдинг Дж, Реммерт М, Бигерт А (2006). «HHrep: обнаружение повторов белка de novo и происхождение бочек TIM». Нуклеиновые кислоты Res. 34 (Проблема с веб-сервером): W137-42. Дои:10.1093 / нар / gkl130. ЧВК 1538828. PMID 16844977.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Бигерт А., Сёдинг Дж. (2008). «De novo идентификация сильно дивергированных белковых повторов по вероятностной последовательности». Биоинформатика. 24 (6): 807–14. Дои:10.1093 / биоинформатика / btn039. PMID 18245125.
- ^ Грубер М, Сёдинг Дж, Лупас А.Н. (2005). «REPPER - повторы и их периодичность в волокнистых белках». Нуклеиновые кислоты Res. 33 (Проблема с веб-сервером): W239-43. Дои:10.1093 / нар / gki405. ЧВК 1160166. PMID 15980460.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Шапер Э, Анисимова М (2015). «Эволюция и функция белковых тандемных повторов у растений». Новый Фитол. 206 (1): 397–410. Дои:10.1111 / nph.13184. PMID 25420631.
- ^ Абрахам А.Л., Роча Е.П., Потье Дж. (2008). «Swelfe: детектор внутренних повторов в последовательностях и структурах». Биоинформатика. 24 (13): 1536–7. Дои:10.1093 / биоинформатика / btn234. ЧВК 2718673. PMID 18487242.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Сабаринатан Р., Басу Р., Секар К. (2010). «ProSTRIP: метод поиска подобных структурных повторов в трехмерных белковых структурах». Comput Biol Chem. 34 (2): 126–30. Дои:10.1016 / j.compbiolchem.2010.03.006. PMID 20430700.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Уолш И., Сирокко Ф.Г., Минервини Дж., Ди Доменико Т., Феррари С, Тосатто СК (2012). «РАФАЭЛЬ: распознавание, периодичность и вставка соленоидных белковых структур». Биоинформатика. 28 (24): 3257–64. Дои:10.1093 / биоинформатика / bts550. PMID 22962341.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Грабе Т, Годзик А (2014). «ConSole: использование модульности карт контактов для определения местоположения соленоидных доменов в белковых структурах». BMC Bioinformatics. 15: 119. Дои:10.1186/1471-2105-15-119. ЧВК 4021314. PMID 24766872.
- ^ Do Viet P, Roche DB, Kajava AV (2015). «ТАПО: комбинированный метод идентификации тандемных повторов в белковых структурах». FEBS Lett. 589 (19 Pt A): 2611–9. Дои:10.1016 / j.febslet.2015.08.025. PMID 26320412. S2CID 28423787.CS1 maint: несколько имен: список авторов (ссылка на сайт)