Сиротский ген - Orphan gene

Гены-сироты (также называемый ORF ответ, особенно в микробной литературе)[1][2] находятся гены без обнаруживаемого гомологи в других линиях.[2] Сироты - это подмножество таксономически ограниченных генов (TRG), которые уникальны для определенного таксономического уровня (например, специфичных для растений).[3] В отличие от несиротских TRG, сироты обычно считаются уникальными для очень узкого таксона, как правило, вида.

Классическая модель эволюции основана на дупликации, перегруппировке и мутации генов с идеей общего происхождения.[4][5] Гены-сироты различаются тем, что они специфичны для клонов без известной истории общих дупликаций и реаранжировок за пределами их конкретных видов или кладов.[6] Гены-сироты могут возникать по разным причинам, например: горизонтальный перенос генов, дублирование и быстрое расхождение, и de novo появление из некодирующая последовательность.[2] Эти процессы могут действовать с разной скоростью у насекомых, приматов и растений.[7] Несмотря на свое относительно недавнее происхождение, гены-сироты могут кодировать функционально важные белки.[8][9]

История генов-сирот

Гены-сироты были впервые обнаружены, когда в 1996 году начался проект по секвенированию генома дрожжей.[2] На гены-сироты приходилось примерно 26% генома дрожжей, но считалось, что эти гены можно отнести к гомологам после секвенирования большего числа геномов.[3] В то время дупликация генов считалась единственной серьезной моделью эволюции генов.[2][4][10] и было несколько секвенированных геномов для сравнения, поэтому считалось, что отсутствие поддающихся обнаружению гомологов, скорее всего, связано с отсутствием данных о секвенировании, а не с истинным отсутствием гомологии.[3] Однако гены-сироты продолжали сохраняться по мере роста количества секвенированных геномов,[3][11] в конечном итоге приводит к выводу, что гены-сироты повсеместно распространены во всех геномах.[2] Оценки процента генов, оставшихся сиротами, сильно различаются между видами и исследованиями; 10-30% - это обычно цитируемая цифра.[3]

Изучение генов-сирот возникло в значительной степени на рубеже веков. В 2003 году исследование Caenorhabditis briggsae и родственные виды сравнили более 2000 генов.[3] Они предположили, что эти гены должны эволюционировать слишком быстро, чтобы их можно было обнаружить, и, следовательно, являются участками очень быстрой эволюции.[3] В 2005 году Уилсон исследовал 122 вида бактерий, чтобы попытаться выяснить, правомерно ли большое количество сиротских генов у многих видов.[11] Исследование показало, что это было законно и сыграло роль в адаптации бактерий. Определение таксономически ограниченных генов было введено в литературу, чтобы гены-сироты казались менее «загадочными».[11]

В 2008 году было обнаружено, что дрожжевой белок с установленной функциональностью, BSC4, произошел de novo из некодирующих последовательностей, гомология которых все еще обнаруживалась у сестринских видов.[12]

В 2009 году был обнаружен сиротский ген, регулирующий внутреннюю биологическую сеть: сиротский ген QQS из Arabidopsis thaliana изменяет состав растений.[13] Орфанный белок QQS взаимодействует с консервативным фактором транскрипции, эти данные объясняют изменения в составе (увеличение количества белка), которые индуцируются, когда QQS внедряется в различные виды.[14] В 2011 году на модельном растении было проведено всестороннее геномное исследование распространения и эволюционного происхождения орфанных генов у растений. Arabidopsis thaliana "[15]

Как определить гены-сироты

Гены можно условно классифицировать как сиротские, если у ближайших видов не обнаруживаются ортологичные белки.[7]

Одним из методов, используемых для оценки сходства нуклеотидных или белковых последовательностей, указывающих на гомологию (т. Е. Сходства из-за общего происхождения), является инструмент поиска базового локального выравнивания (BLAST). BLAST позволяет быстро искать последовательности запросов в больших базах данных последовательностей.[16][17] Моделирование предполагает, что при определенных условиях BLAST подходит для обнаружения дальних родственников гена.[18] Однако BLAST может легко пропустить гены, которые короткие и быстро эволюционируют.[19]

Систематическое обнаружение гомологии аннотированных генов-сирот называется филостратиграфией.[20] Филостратиграфия создает филогенетическое древо, в котором вычисляется гомология между всеми генами одного вида и генами других видов. Самый ранний общий предок гена определяет возраст или филострат, гена. Термин «сирота» иногда используется только для самого молодого филострата, содержащего только один вид, но при широком толковании как таксономически ограниченный ген он может относиться ко всем, кроме самого старого филострата, с геном, осиротевшим в более крупной кладе.

Откуда берутся гены-сироты?

Гены-сироты возникают из множества источников, преимущественно в результате возникновения de novo, дупликации и быстрой дивергенции, а также горизонтального переноса генов.[2]

De Novo Origination

Новые сиротские гены постоянно возникают de novo из некодирующих последовательностей.[21] Эти новые гены могут быть достаточно полезными, чтобы их можно было зафиксировать путем отбора. Или, что более вероятно, они снова отойдут на негенный фон. Последний вариант подтверждается исследованиями на Drosophila, показывающими, что молодые гены с большей вероятностью вымирают.[22]

Когда-то считалось, что гены de novo практически невозможны из-за сложных и потенциально хрупких тонкостей создания и поддержания функциональных полипептидов.[10] но исследования последних 10 лет или около того обнаружили множество примеров генов de novo, некоторые из которых связаны с важными биологическими процессами, особенно с функцией яичек у животных. Гены de novo были также обнаружены у грибов и растений.[12][23][24][5][25][26][27][28]

Для молодых генов-сирот иногда можно найти гомологичные некодирующие последовательности ДНК в сестринских таксонах, что обычно считается убедительным доказательством происхождения de novo. Тем не менее, вклад de novo происхождения в таксономически ограниченные гены более древнего происхождения, особенно в отношении традиционной теории дупликации генов эволюции генов, остается спорным.[29][30]

Дублирование и расхождение

Модель дупликации и дивергенции для сиротских генов включает в себя новый ген, созданный в результате некоторого события дупликации или дивергенции и переживающий период быстрой эволюции, когда все обнаруживаемое сходство с первоначально дублированным геном теряется.[2] Хотя это объяснение согласуется с текущим пониманием механизмов дублирования,[2] количество мутаций, необходимых для потери обнаруживаемого сходства, достаточно велико, чтобы быть редким событием,[2][18] и эволюционный механизм, с помощью которого дубликат гена мог быть изолирован и так быстро расходиться, остается неясным.[2][31]

Горизонтальный перенос генов

Другое объяснение возникновения генов-сирот связано с механизмом дупликации, который называется горизонтальный перенос генов, где исходный дублированный ген происходит от отдельной неизвестной линии.[2] Это объяснение происхождения генов-сирот особенно актуально для бактерий и архей, где горизонтальный перенос генов обычен.

Характеристики белков

Гены-сироты, как правило, очень короткие (примерно в 6 раз короче зрелых генов), а некоторые слабо экспрессируются, тканеспецифичны и более просты в использовании кодонов и аминокислотном составе.[32] Гены-сироты имеют тенденцию кодировать больше внутренне неупорядоченные белки[33][34][35], хотя некоторая структура была обнаружена в одном из наиболее охарактеризованных орфанных генов[36]. Из десятков тысяч ферментов первичного или специализированного метаболизма, которые были охарактеризованы на сегодняшний день, ни один не является сиротским или даже ограниченным по происхождению; по-видимому, для катализа требуются сотни миллионов лет эволюции.[32]

Биологические функции

Несмотря на то, что преобладание генов-сирот установлено, эволюционная роль сирот и, как следствие, ее важность все еще обсуждаются. Одна из теорий состоит в том, что многие сироты не играют никакой эволюционной роли; геномы содержат нефункциональные открытые рамки считывания (ORF), которые создают ложные полипептидные продукты, не поддерживаемые селекцией, а это означает, что они вряд ли сохранятся между видами и, вероятно, будут обнаружены как сиротские гены.[3] Однако множество других исследований показали, что по крайней мере некоторые сироты функционально важны и могут помочь объяснить появление новых фенотипов.[2][3][11][13][14][15]

Рекомендации

  1. ^ Fischer, D .; Айзенберг, Д. (1 сентября 1999 г.). «Поиск семей для геномных ORFan». Биоинформатика. 15 (9): 759–762. Дои:10.1093 / биоинформатика / 15.9.759. PMID  10498776.
  2. ^ а б c d е ж грамм час я j k л м Tautz, D .; Домазет-Лошо, Т. (2011). «Эволюционное происхождение генов-сирот». Природа Обзоры Генетика. 12 (10): 692–702. Дои:10.1038 / nrg3053. PMID  21878963.
  3. ^ а б c d е ж грамм час я Халтурин, К; Хеммрих, G; Fraune, S; Августин, Р. Bosch, TC (2009). «Больше, чем просто сироты: важны ли таксономически ограниченные гены в эволюции?». Тенденции в генетике. 25 (9): 404–413. Дои:10.1016 / j.tig.2009.07.006. PMID  19716618.
  4. ^ а б Оно, Сусуму (11 декабря 2013 г.). Эволюция путем дублирования генов. Springer Science & Business Media. ISBN  978-3-642-86659-3.
  5. ^ а б Чжоу, Ци; Чжан, Гоцзе; Чжан, Юэ; Сюй, Шию; Чжао, Руопин; Жан, Зубинг; Ли, Синь; Дин, Юнь; Ян, Шуанг (1 сентября 2008 г.). «О происхождении новых генов у дрозофилы». Геномные исследования. 18 (9): 1446–1455. Дои:10.1101 / гр.076588.108. ЧВК  2527705. PMID  18550802.
  6. ^ Толл-Риера, М .; Bosch, N .; Bellora, N .; Castelo, R .; Арменгол, Л .; Estivill, X .; Альба, М. М. (2009). «Происхождение генов-сирот приматов: подход сравнительной геномики». Молекулярная биология и эволюция. 26 (3): 603–612. Дои:10.1093 / молбев / msn281. PMID  19064677.
  7. ^ а б Wissler, L .; Gadau, J .; Simola, D. F .; Helmkampf, M .; Борнберг-Бауэр, Э. (2013). «Механизмы и динамика появления орфанных генов в геномах насекомых». Геномная биология и эволюция. 5 (2): 439–455. Дои:10.1093 / gbe / evt009. ЧВК  3590893. PMID  23348040.
  8. ^ Рейнхардт, Жозефина А .; Wanjiru, Betty M .; Брант, Алисия Т .; Саелао, Перо; Бегун, Дэвид Дж .; Джонс, Корбин Д. (17 октября 2013 г.). «ORF De Novo у дрозофилы важны для приспособленности организма и быстро эволюционировали из ранее некодирующих последовательностей». PLoS Genet. 9 (10): e1003860. Дои:10.1371 / journal.pgen.1003860. ЧВК  3798262. PMID  24146629.
  9. ^ Суэнага, Юске; Ислам, С. М. Рафикул; Алагу, Дженнифер; Канеко, Йошики; Като, Мамору; Танака, Юкичи; Кавана, Хидетада; Хосейн, Шамим; Мацумото, Дайсуке (2 января 2014 г.). «NCYM, цис-антисмысловой ген MYCN, кодирует развитый De Novo белок, который ингибирует GSK3β, что приводит к стабилизации MYCN в нейробластомах человека». PLoS Genet. 10 (1): e1003996. Дои:10.1371 / journal.pgen.1003996. ЧВК  3879166. PMID  24391509.
  10. ^ а б Джейкоб, Ф. (10 июня 1977 г.). «Эволюция и ковыряние». Наука. 196 (4295): 1161–1166. Bibcode:1977Sci ... 196.1161J. Дои:10.1126 / science.860134. PMID  860134.
  11. ^ а б c d Wilson, G.A .; Bertrand, N .; Patel, Y .; Hughes, J. B .; Feil, E. J .; Филд, Д. (2005). «Сироты как таксономически ограниченные и экологически важные гены». Микробиология. 151 (8): 2499–2501. Дои:10.1099 / мик. 0.28146-0. PMID  16079329.
  12. ^ а б Цай, Цзин; Чжао, Руопин; Цзян, Хуйфэн; Ван, Вэнь (1 мая 2008 г.). «Создание De Novo нового гена, кодирующего белок, в Saccharomyces cerevisiae». Генетика. 179 (1): 487–496. Дои:10.1534 / генетика.107.084491. ЧВК  2390625. PMID  18493065.
  13. ^ а б Li, L .; Foster, C.M .; Gan, Q .; Nettleton, D .; James, M. G .; Майерс, А. М .; Вуртеле, Э. С. (2009). «Идентификация нового белка QQS как компонента метаболической сети крахмала в листьях Arabidopsis». Журнал растений. 58 (3): 485–498. Дои:10.1111 / j.1365-313X.2009.03793.x. PMID  19154206.
  14. ^ а б Ли, Л; Чжэн, Вт; Чжу, Y; Ye, H; Тан, B; Arendsee, Z; Джонс, Д.; Li, R; Ортис, Д; Чжао, X; Du, C; Nettleton, D; Скотт, П.; Салас-Фернандес, М; Инь, Y; Вуртеле, ES (2015). «Орфанный ген QQS регулирует распределение углерода и азота между видами посредством взаимодействий NF-YC». Proc. Natl. Акад. Наука. 112 (47): 14734–14739. Bibcode:2015ПНАС..11214734Л. Дои:10.1073 / pnas.1514670112. ЧВК  4664325. PMID  26554020.
  15. ^ а б Донохью, М.Т.А.; Keshavaiah, C .; Swamidatta, S.H .; Спиллейн, К. (2011). «Эволюционное происхождение специфических генов Brassicaceae у Arabidopsis thaliana». BMC Эволюционная биология. 11 (1): 47. Дои:10.1186/1471-2148-11-47. ЧВК  3049755. PMID  21332978.
  16. ^ Альтчул С. (1 сентября 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базе данных белков». Исследования нуклеиновых кислот. 25 (17): 3389–3402. Дои:10.1093 / nar / 25.17.3389. ЧВК  146917. PMID  9254694.
  17. ^ "Домашняя страница NCBI BLAST".
  18. ^ а б Альба, М; Кастресана, Дж. (2007). «О поисках гомологии с помощью белка BLAST и характеристике возраста генов». BMC Evol. Биол. 7: 53. Дои:10.1186/1471-2148-7-53. ЧВК  1855329. PMID  17408474.
  19. ^ Мойерс, Б. А .; Чжан, Дж. (13 октября 2014 г.). «Филостратиграфическое смещение создает ложные паттерны эволюции генома». Молекулярная биология и эволюция. 32 (1): 258–267. Дои:10.1093 / молбев / мсу286. ЧВК  4271527. PMID  25312911.
  20. ^ Домазет-Лошо, Томислав; Брайкович, Йосип; Тауц, Дитхард (11 января 2007 г.). «Филостратиграфический подход для раскрытия геномной истории основных адаптаций в линиях многократных животных». Тенденции в генетике. 23 (11): 533–539. Дои:10.1016 / j.tig.2007.08.014. PMID  18029048.
  21. ^ McLysaght, Aoife; Герцони, Даниэле (31 августа 2015 г.). «Новые гены из некодирующей последовательности: роль генов de novo, кодирующих белок, в эволюционных инновациях эукариот». Философские труды Королевского общества B: биологические науки. 370 (1678): 20140332. Дои:10.1098 / rstb.2014.0332. ЧВК  4571571. PMID  26323763.
  22. ^ Пальмиери, Никола; Kosiol, Кэролин; Шлёттерер, Кристиан (19 февраля 2014 г.). «Жизненный цикл сиротских генов». eLife. 3: e01311. Дои:10.7554 / eLife.01311. ЧВК  3927632. PMID  24554240.
  23. ^ Чжао, Ли; Саелао, Перо; Джонс, Корбин Д .; Бегун, Дэвид Дж. (14 февраля 2014 г.). «Происхождение и распространение генов de Novo в популяциях Drosophila melanogaster». Наука. 343 (6172): 769–772. Bibcode:2014Научный ... 343..769Z. Дои:10.1126 / science.1248286. ЧВК  4391638. PMID  24457212.
  24. ^ Левин, Миа Т .; Джонс, Корбин Д .; Керн, Эндрю Д .; Lindfors, Heather A .; Бегун, Дэвид Дж. (27 июня 2006 г.). «Новые гены, полученные из некодирующей ДНК у Drosophila melanogaster, часто являются X-сцепленными и демонстрируют экспрессию, обусловленную смещением в яичках». Труды Национальной академии наук. 103 (26): 9935–9939. Bibcode:2006PNAS..103.9935L. Дои:10.1073 / pnas.0509809103. ЧВК  1502557. PMID  16777968.
  25. ^ Heinen, Tobias J.A.J .; Штаубах, Фабиан; Хэминг, Даниэла; Тауц, Дитард (29 сентября 2009 г.). «Появление нового гена из межгенной области». Текущая биология. 19 (18): 1527–1531. Дои:10.1016 / j.cub.2009.07.049. PMID  19733073.
  26. ^ Чен, Сиди; Zhang, Yong E .; Лонг, Маньюань (17 декабря 2010 г.). «Новые гены дрозофилы быстро становятся необходимыми». Наука. 330 (6011): 1682–1685. Bibcode:2010Sci ... 330.1682C. Дои:10.1126 / science.1196380. ЧВК  7211344. PMID  21164016.
  27. ^ Рейнхардт, Жозефина А .; Wanjiru, Betty M .; Брант, Алисия Т .; Саелао, Перо; Бегун, Дэвид Дж .; Джонс, Корбин Д. (17 октября 2013 г.). «ORF De Novo у дрозофилы важны для приспособленности организма и быстро эволюционировали из ранее некодирующих последовательностей». PLOS Genet. 9 (10): e1003860. Дои:10.1371 / journal.pgen.1003860. ЧВК  3798262. PMID  24146629.
  28. ^ Silveira AB, Trontin C, Cortijo S, Barau J, Del-Bem LE, Loudet O, Colot V, Vincentz M (2013). «Обширные естественные эпигенетические вариации в генах, происходящих от De Novo». PLoS Genetics. 9 (4): e1003437. Дои:10.1371 / journal.pgen.1003437. ЧВК  3623765. PMID  23593031.
  29. ^ Неме, Рафик; Тауц, Дитард (17 марта 2014 г.). "Эволюция: динамика появления гена De Novo". Текущая биология. 24 (6): R238 – R240. Дои:10.1016 / j.cub.2014.02.016. PMID  24650912.
  30. ^ Мойерс, Брайан А .; Чжан, Цзяньчжи (11 января 2016 г.). «Оценка филостратиграфических свидетельств широко распространенного рождения гена de novo в эволюции генома». Молекулярная биология и эволюция. 33 (5): 1245–56. Дои:10.1093 / molbev / msw008. ЧВК  5010002. PMID  26758516.
  31. ^ Линч, Майкл; Катю, Вайшали (1 ноября 2004 г.). «Измененные эволюционные траектории дубликатов генов». Тенденции в генетике. 20 (11): 544–549. CiteSeerX  10.1.1.335.7718. Дои:10.1016 / j.tig.2004.09.001. PMID  15475113.
  32. ^ а б Arendsee, Zebulun W .; Ли, Линг; Вуртеле, Ева Сыркина (ноябрь 2014 г.). «Достигнув совершеннолетия: гены-сироты у растений». Тенденции в растениеводстве. 19 (11): 698–708. Дои:10.1016 / j.tplants.2014.07.003. PMID  25151064.
  33. ^ Mukherjee, S .; Панда, А .; Гош, Т. (Июнь 2015 г.). "Выяснение эволюционных особенностей и функциональных последствий сиротских генов в Leishmania major". Инфекция, генетика и эволюция. 32: 330–337. Дои:10.1016 / j.meegid.2015.03.031. PMID  25843649.
  34. ^ Wilson, Benjamin A .; Фой, Скотт Дж .; Неме, Рафик; Масел, Джоанна (24 апреля 2017 г.). «Молодые гены сильно неупорядочены, как предсказывает преадаптационная гипотеза рождения гена de novo». Природа Экология и эволюция. 1 (6): 0146–146. Дои:10.1038 / s41559-017-0146. ЧВК  5476217. PMID  28642936.
  35. ^ Уиллис, Сара; Масел, Джоанна (19 июля 2018 г.). «Рождение гена способствует структурному нарушению, кодируемому перекрывающимися генами». Генетика. 210 (1): 303–313. Дои:10.1534 / генетика.118.301249. ЧВК  6116962. PMID  30026186.
  36. ^ Бунгард, Дикси; Copple, Jacob S .; Ян, Цзин; Чхун, Джимми Дж .; Кумиров, Влад К .; Фой, Скотт Дж .; Масел, Джоанна; Wysocki, Vicki H .; Кордес, Мэтью Х.Дж. (ноябрь 2017 г.). «Складываемость природного протеина De Novo Evolved». Структура. 25 (11): 1687–1696.e4. Дои:10.1016 / j.str.2017.09.006. ЧВК  5677532. PMID  29033289.