Предполагаемый горизонтальный перенос генов - Inferring horizontal gene transfer
Горизонтальный или латеральный перенос генов (HGT или LGT) - это передача частей геномного ДНК между организмами посредством процесса, не связанного с вертикальное наследование. При наличии событий HGT различные фрагменты геном являются результатом различных эволюционный истории. Следовательно, это может усложнить исследования эволюционного родства родословных и видов. Кроме того, поскольку HGT может внести в геномы радикально разные генотипы из далеких родов или даже из новых гены неся новые функции, он является основным источником фенотипический инновации и механизм адаптация ниши. Например, особое значение для здоровья человека имеет боковой перенос устойчивость к антибиотикам и патогенность детерминанты, приводящие к возникновению патогенных линий.[1]
Предполагаемый горизонтальный перенос генов через вычислительный Идентификация событий HGT основана на исследовании состава последовательности или эволюционной истории генов. Методы, основанные на композиции последовательностей ("параметрические"), ищут отклонения от среднего геномного значения, тогда как методы, основанные на эволюционной истории ("филогенетический ") подходы выявляют гены, эволюционная история которых значительно отличается от истории хозяина разновидность. Оценка и сравнительный анализ методов вывода HGT обычно основываются на смоделированных геномах, истинная история которых известна. На реальных данных разные методы имеют тенденцию делать выводы о различных событиях HGT, и в результате может быть трудно установить все, кроме простых и четких событий HGT.
Обзор
Горизонтальный перенос генов впервые был обнаружен в 1928 г. Фредерик Гриффит с эксперимент: показывает, что вирулентность могла переходить от вирулентных штаммов к невирулентным Пневмококк, Гриффит продемонстрировал, что генетическая информация может горизонтально передаваться между бактерии через механизм, известный как трансформация.[2] Подобные наблюдения в 1940-х гг.[3] и 1950-е[4] показали доказательства того, что спряжение и трансдукция дополнительные механизмы горизонтального переноса генов.[5]
Сделать вывод о событиях HGT, которые не обязательно могут привести к фенотипический изменений, большинство современных методов основаны на анализе данных геномной последовательности. Эти методы можно условно разделить на две группы: параметрические и филогенетические методы. Параметрические методы ищут участки генома, которые значительно отличаются от среднего генома, например Содержимое GC или же использование кодонов.[6] Филогенетические методы исследуют эволюционные истории задействованных генов и выявляют конфликтующие филогении. Филогенетические методы можно разделить на те, которые реконструируют и сравнивают филогенетические деревья явно, и те, которые используют суррогатные меры вместо филогенетических деревьев.[7]
Основная особенность параметрических методов заключается в том, что они полагаются только на исследуемый геном, чтобы сделать вывод о событиях HGT, которые могли произойти в его линии. Это было значительным преимуществом на заре эры секвенирования, когда для сравнительных методов было доступно несколько тесно связанных геномов. Однако, поскольку они полагаются на однородность сигнатуры хозяина для вывода событий HGT, отсутствие учета внутригеномной изменчивости хозяина приведет к завышению прогнозов - пометке нативных сегментов как возможных событий HGT.[8] Точно так же переданные сегменты должны иметь подпись донора и существенно отличаться от подписи получателя.[6] Кроме того, на геномные сегменты иностранного происхождения распространяются те же мутационный процессы, как и остальная часть генома хозяина, и поэтому разница между ними имеет тенденцию исчезать с течением времени, и этот процесс называется улучшением.[9] Это ограничивает возможности параметрических методов обнаружения древних HGT.
Филогенетические методы извлекают выгоду из недавней доступности много секвенированных геномов. Действительно, как и все Сравнительная степень методы, филогенетические методы могут интегрировать информацию из нескольких геномов и, в частности, интегрировать их, используя модель эволюции. Это дает им возможность лучше охарактеризовать события HGT, которые они делают, в частности, путем определения вида донора и времени передачи. Однако у моделей есть ограничения, и их нужно использовать осторожно. Например, конфликтующие филогении могут быть результатом событий, не учитываемых моделью, таких как нераспознанные паралогия из-за дублирование с последующим потеря генов. Кроме того, многие подходы основаны на эталонном дереве видов, которое должно быть известным, хотя во многих случаях получить надежное дерево может быть сложно. Наконец, вычислительные затраты на реконструкцию многих деревьев генов / видов могут быть непомерно высокими. Филогенетические методы обычно применяются к генам или белковые последовательности в качестве основных эволюционных единиц, что ограничивает их способность обнаруживать HGT в регионах за пределами или за границами генов.
Из-за их взаимодополняющих подходов - и часто не пересекающихся наборов кандидатов на HGT - комбинирование предсказания параметрических и филогенетических методов может дать более полный набор HGT гены-кандидаты. Действительно, сообщалось, что комбинирование различных параметрических методов значительно улучшает качество прогнозов.[10][11] Более того, в отсутствие исчерпывающего набора истинных горизонтально переносимых генов несоответствия между различными методами[12][13] может быть решена путем сочетания параметрических и филогенетических методов. Однако объединение выводов из нескольких методов также влечет за собой риск увеличения ложноположительный показатель.[14]
Параметрические методы
Параметрические методы для вывода HGT используют характеристики последовательности генома, специфичные для конкретных видов или клады, также называемый геномные подписи. Если фрагмент генома сильно отклоняется от геномной сигнатуры, это признак потенциального горизонтального переноса. Например, поскольку содержание GC у бактерий попадает в широкий диапазон, содержание GC в сегменте генома является простой геномной сигнатурой. Обычно используемые геномные подписи включают: нуклеотид сочинение,[15] олигонуклеотид частоты,[16] или структурные особенности генома.[17]
Чтобы обнаружить HGT с помощью параметрических методов, геномная подпись хозяина должна быть четко распознаваемой. Однако геном хозяина не всегда однороден в отношении сигнатуры генома: например, содержание GC в позиции третьего кодона ниже, чем у репликация конечная остановка [18] и содержание GC обычно выше в выразил гены.[19] Отсутствие учета такой внутригеномной изменчивости в хозяине может привести к завышенным прогнозам, отмечая нативные сегменты как кандидатов на HGT.[8] Большие скользящие окна могут учитывать эту изменчивость за счет снижения способности обнаруживать более мелкие области HGT.[12]
Не менее важно, что горизонтально перенесенные сегменты должны демонстрировать геномную подпись донора. Это может не относиться к древним переносам, когда переданные последовательности подвергаются тем же мутационным процессам, что и остальная часть генома хозяина, потенциально вызывая «улучшение» их отдельных сигнатур.[9] и становятся необнаруживаемыми с помощью параметрических методов. Например, Bdellovibrio bacteriovorus, хищный δ-Proteobacterium, имеет гомогенное содержание GC, и можно сделать вывод, что его геном устойчив к HGT.[20] Однако последующий анализ с использованием филогенетических методов выявил ряд древних событий HGT в геноме B. bacteriovorus.[21] Точно так же, если вставленный сегмент ранее был улучшен в геноме хозяина, как в случае профаг вставки,[22] параметрические методы могут не предсказывать эти события HGT. Кроме того, состав донора должен значительно отличаться от состава реципиента, чтобы его можно было идентифицировать как ненормальное, состояние, которое можно пропустить в случае ГПГ на короткие и средние дистанции, которые являются наиболее распространенными. Кроме того, сообщалось, что недавно приобретенные гены обычно AT-богаче чем в среднем у получателя,[15] что указывает на то, что различия в сигнатуре GC-содержимого могут быть результатом неизвестных мутационных процессов после приобретения, а не генома донора.
Нуклеотидный состав
Бактериальное содержание GC попадает в широкий диапазон, с Ca. Зиндерия инсектикола с содержанием ГХ 13,5%[23] и Anaeromyxobacter dehalogenans с содержанием ГХ 75%.[24] Даже внутри тесно связанной группы α-протеобактерии, значения варьируются от 30% до 65%.[25] Эти различия могут быть использованы при обнаружении событий HGT, поскольку значительно отличающееся содержание GC для сегмента генома может указывать на иностранное происхождение.[15]
Спектр олигонуклеотидов
Спектр олигонуклеотидов (или к-мер частоты) измеряет частоту всех возможных нуклеотидных последовательностей определенной длины в геноме. Он имеет тенденцию меняться в пределах геномов меньше, чем между геномами, и поэтому также может использоваться в качестве геномной сигнатуры.[26] Отклонение от этой сигнатуры предполагает, что геномный сегмент мог быть доставлен горизонтально.
Спектр олигонуклеотидов во многом обязан своей дискриминационной способностью количеству возможных олигонуклеотидов: если n - размер словаря, а w - размер олигонуклеотида, количество возможных различных олигонуклеотидов это пш; например, есть 45= 1024 возможных пентануклеотидов. Некоторые методы могут фиксировать сигнал, записанный в виде мотивов переменного размера,[27] Таким образом улавливаются как редкие, так и отличительные мотивы наряду с частыми, но более распространенными.
Предвзятость использования кодонов, мера, связанная с кодон частот, был одним из первых методов обнаружения, использованных при методической оценке HGT.[16] Для этого подхода требуется геном хозяина, который содержит предвзятость по отношению к определенным синонимичным кодонам (разные кодоны, которые кодируют одну и ту же аминокислоту), что явно отличается от предвзятости, обнаруженной в геноме донора. Простейшим олигонуклеотидом, используемым в качестве геномной сигнатуры, является динуклеотид, например, третий нуклеотид в кодоне, а первый нуклеотид в следующем кодоне представляет динуклеотид, наименее ограниченный аминокислота предпочтение и использование кодонов.[28]
Важно оптимизировать размер скользящего окна, в котором следует подсчитывать частоту олигонуклеотидов: большее скользящее окно лучше буферизует изменчивость в геноме хозяина за счет худшего обнаружения меньших участков HGT.[29] Сообщается о хорошем компромиссе при использовании частот тетрануклеотидов в скользящем окне 5kb с шагом 0,5кб.[30]
Удобным методом моделирования геномных сигнатур олигонуклеотидов является использование Цепи Маркова. Матрица вероятности перехода может быть получена для эндогенных и приобретенных генов,[31] откуда байесовский апостериорные вероятности для конкретных участков ДНК могут быть получены.[32]
Конструктивные особенности
Так же, как нуклеотидный состав молекулы ДНК может быть представлен последовательностью букв, ее структурные особенности могут быть закодированы в числовой последовательности. Конструктивные особенности включают энергии взаимодействия между соседними парами оснований,[33] угол закручивания, составляющий два основания пара не-копланарный,[34] или деформируемость ДНК, вызванная белками, формирующими хроматин.[35]
В автокорреляция Анализ некоторых из этих числовых последовательностей показывает характерные периодичности в полных геномах.[36] Фактически, после обнаружения археи -подобные регионы в теплолюбивый бактерии Thermotoga maritima,[37] спектры периодичности этих областей сравнивались со спектрами периодичности гомологичный регионы в архее Pyrococcus horikoshii.[17] Обнаруженное сходство в периодичности явилось убедительным подтверждающим доказательством случая массивного ГПГ между бактериями и археями. королевства.[17]
Геномный контекст
Существование геномные острова, короткие (обычно длиной 10–200 килобайт) участки генома, полученные горизонтально, подтверждают способность идентифицировать неместные гены по их место расположения в геноме.[38] Например, ген неоднозначного происхождения, который является частью неродного оперон может считаться неродным. Как вариант, фланговый повторять последовательности или наличие поблизости интегрирует или же транспозиции может указывать на неродной регион.[39] А машинное обучение Подход, сочетающий сканирование частоты олигонуклеотидов с контекстной информацией, оказался эффективным при идентификации геномных островов.[40] В другом исследовании контекст использовался в качестве вторичного индикатора после удаления генов, которые строго считаются нативными или неродными, с помощью других параметрических методов.[10]
Филогенетические методы
Использование филогенетического анализа в обнаружении HGT было продвинуто благодаря доступности многих недавно секвенированных геномов. Филогенетические методы обнаруживают несоответствия в истории эволюции генов и видов двумя способами: явно, путем реконструкции дерева генов и согласования его с деревом эталонных видов, или неявно, путем изучения аспектов, которые коррелируют с историей эволюции рассматриваемых генов, например, закономерности присутствия / отсутствия у разных видов или неожиданно короткие или далекие попарные эволюционные дистанции.
Явные филогенетические методы
Целью явных филогенетических методов является сравнение деревьев генов с деревьями связанных с ними видов. Хотя слабо подтвержденные различия между деревьями генов и видов могут быть связаны с неопределенностью вывода, статистически значимые различия могут указывать на события HGT. Например, если два гена от разных видов имеют общий самый последний предковый соединительный узел в дереве генов, но соответствующие виды разнесены в дереве видов, может быть вызвано событие HGT. Такой подход может дать более подробные результаты, чем параметрический подход, поскольку потенциально могут быть идентифицированы вовлеченные виды, время и направление переноса.
Как более подробно обсуждается ниже, филогенетические методы варьируются от простых методов, просто идентифицирующих несоответствие между деревьями генов и видов, до механистических моделей, предполагающих вероятные последовательности событий HGT. Промежуточная стратегия включает в себя деконструкцию дерева генов на более мелкие части, пока каждая из них не будет соответствовать дереву видов (спектральные подходы к геному).
Явные филогенетические методы полагаются на точность входных корневых генов и деревьев видов, но их может быть сложно построить.[41] Даже если во входных деревьях нет сомнений, конфликтующие филогении могут быть результатом эволюционных процессов, отличных от HGT, таких как дублирование и потери, в результате чего эти методы ошибочно определяют события HGT, когда паралогия это правильное объяснение. Аналогично при наличии неполная сортировка по происхождению, явные методы филогении могут ошибочно вывести события HGT.[42] Вот почему некоторые явные методы, основанные на моделях, проверяют множество сценариев эволюции, включающих различные виды событий, и сравнивают их соответствие приведенным данным. скупой или же вероятностный критерии.
Тесты топологий
Чтобы обнаружить наборы генов, которые плохо соответствуют ссылочному дереву, можно использовать статистические тесты топологии, такой как Кишино – Хасегава (KH),[43] Симодаира – Хасэгава (SH),[44] и приблизительно беспристрастный (AU)[45] тесты. Эти тесты оценивают вероятность гена выравнивание последовательностей когда эталонная топология задана как нулевая гипотеза.
Отклонение ссылки топология указывает на то, что эволюционная история этого генная семья несовместимо с ссылочным деревом. Когда эти несоответствия не могут быть объяснены с помощью небольшого количества негоризонтальных событий, таких как потеря и дупликация гена, предполагается событие HGT.
Один из таких анализов проверил HGT в группах гомологов γ-протеобактериальные происхождение.[46] Шесть референсных деревьев были реконструированы с использованием либо высококонсервативных последовательностей малых субъединиц рибосомных РНК, консенсуса доступных генов деревьев или конкатенированных выравниваний ортологи. Неспособность отклонить шесть оцененных топологий и отклонение семи альтернативных топологий были интерпретированы как свидетельство небольшого количества событий HGT в выбранных группах.
Тесты топологии выявляют различия в топологии дерева, принимая во внимание неопределенность вывода дерева, но они не делают попытки вывести как возникли различия. Чтобы сделать вывод об особенностях конкретных событий, спектральных или обрезка и пересадка поддерева методы обязательны.
Спектральные подходы генома
Чтобы идентифицировать местоположение событий HGT, спектральные подходы генома разбивают дерево генов на подструктуры (например, двудольные или квартеты) и определите те, которые соответствуют или несовместимы с деревом видов.
ДвудольныеУдаление одного край из ссылочного дерева получается два несвязанных поддерева, каждое из которых представляет собой непересекающийся набор узлов - двудерево. Если и в гене, и в деревьях видов присутствует двудольность, она совместима; в противном случае это противоречиво. Эти конфликты могут указывать на событие HGT или могут быть результатом неопределенности в выводе генного дерева. Чтобы уменьшить неопределенность, анализ двудольных разделений обычно фокусируется на сильно поддерживаемых разделениях, например связанных с ветвями с бутстрап значения или апостериорные вероятности выше определенных пороговых значений. Любое семейство генов, у которого обнаружено одно или несколько конфликтующих, но сильно поддерживаемых, двудольных делений, рассматривается как кандидат на ГПГ.[47][48][49]
Квартетная декомпозицияКвартеты - это деревья, состоящие из четырех листьев. В бифуркационных (полностью разрешенных) деревьях каждая внутренняя ветвь порождает квартет, листья которого являются либо поддеревьями исходного дерева, либо реальными листьями исходного дерева. Если топология квартета, извлеченная из дерева эталонных видов, встроена в дерево генов, квартет совместим с деревом генов. И наоборот, несовместимые квартеты с сильной поддержкой указывают на потенциальные события HGT.[50] Методы отображения квартета - это гораздо больше вычислительно эффективный и естественно обрабатывать гетерогенное представление таксонов среди семейств генов, что делает их хорошей основой для разработки крупномасштабных сканирований для HGT, поиска путей обмена генами в базах данных, содержащих сотни полных геномов.[51][52]
Обрезка и пересадка поддерева
Механистический способ моделирования HGT-события на ссылочном дереве состоит в том, чтобы сначала разрезать внутреннюю ветвь, то есть обрезать дерево, а затем повторно пересадить ее на другое ребро, операция, называемая обрезка и пересадка поддерева (SPR).[53] Если дерево генов было топологически согласованным с исходным ссылочным деревом, редактирование приводит к несогласованности. Точно так же, когда исходное дерево генов несовместимо с ссылочным деревом, можно получить согласованную топологию с помощью серии из одной или нескольких операций обрезки и пересадки, применяемых к ссылочному дереву. Интерпретируя путь редактирования обрезки и пересадки, можно пометить узлы-кандидаты HGT и сделать вывод о геномах хозяина и донора.[49][48][54] Чтобы избежать сообщения о ложноположительных событиях HGT из-за неопределенной топологии дерева генов, оптимальный «путь» операций SPR может быть выбран среди множества возможных комбинаций с учетом поддержки ветвей в дереве генов. Слабо поддерживаемые ребра генного дерева можно априори игнорировать.[55] или опора может использоваться для вычисления критерия оптимальности.[49][56][57][58]
Поскольку преобразование одного дерева в другое минимальным количеством операций SPR является NP-Hard,[59] решение проблемы значительно усложняется при рассмотрении большего числа узлов. Вычислительная задача заключается в нахождении оптимального пути редактирования, то есть такого, который требует наименьшего количества шагов,[60][61] и для решения проблемы используются разные стратегии. Например, алгоритм HorizStory уменьшает проблему, сначала удаляя согласованные узлы;[62] Рекурсивная обрезка и пересадка согласовывают справочное дерево с деревом генов, а оптимальные изменения интерпретируются как события HGT. Методы SPR, включенные в пакет реконструкции супердерева SPRSupertrees, существенно сокращают время поиска оптимального набора операций SPR за счет рассмотрения нескольких локализованных подзадач в больших деревьях с помощью подхода кластеризации.[63] В T-REX (веб-сервер) включает ряд методов обнаружения HGT [56] (в основном на основе SPR) и позволяет пользователям рассчитывать поддержку начальной загрузки предполагаемых передач.[49]
Методы согласования на основе моделей
Согласование генов и деревьев видов влечет за собой отображение эволюционных событий на деревьях генов таким образом, чтобы они согласовывались с деревом видов. Существуют разные модели согласования, различающиеся типами событий, которые они рассматривают для объяснения несоответствий между топологиями генов и видов деревьев. Ранние методы моделировали исключительно горизонтальные переходы (T).[53][57][56] Более свежие также учитывают дублирование (D), потерю (L), неполная сортировка по происхождению (ILS) или гомологичная рекомбинация (HR) события. Сложность состоит в том, что при учете нескольких типов событий количество возможных согласований быстро увеличивается. Например, конфликтующие топологии дерева генов можно объяснить одним событием HGT или несколькими событиями дублирования и потери. Обе альтернативы можно считать правдоподобным согласованием в зависимости от частоты этих соответствующих событий на дереве видов.
Методы согласования могут полагаться на скупой или вероятностный структура для вывода наиболее вероятного сценария (ов), где относительная стоимость / вероятность событий D, T, L может быть зафиксирована априори или оценена на основе данных.[64] Пространство согласований DTL и затраты на их экономию - которые могут быть чрезвычайно обширными для больших генеалогических деревьев с несколькими копиями - могут быть эффективно исследованы с помощью динамическое программирование алгоритмы.[64][65][66] В некоторых программах топология генного дерева может быть уточнена там, где не было уверенности в том, что она соответствует лучшему сценарию эволюции, а также первоначальному выравниванию последовательностей.[65][67][68] Более совершенные модели учитывают смещенную частоту HGT между близкородственными линиями,[69] отражая потерю эффективности HR с филогенетической дистанцией,[70] за ILS,[71] или из-за того факта, что фактические доноры большинства HGT принадлежат к вымершим или неотобранным линиям.[72] Дальнейшие расширения моделей DTL разрабатываются в направлении интегрированного описания процессов эволюции генома. В частности, некоторые из них рассматривают горизонтальность в нескольких масштабах, моделируя независимую эволюцию фрагментов генов.[73] или признавая совместная эволюция нескольких генов (например, из-за совместного переноса) внутри и между геномами.[74][75][76]
Неявные филогенетические методы
В отличие от явных филогенетических методов, которые сравнивают соответствие между деревьями генов и видов, неявные филогенетические методы сравнивают эволюционные расстояния или сходство последовательностей. Здесь неожиданно короткое или большое расстояние от заданного эталона по сравнению со средним значением может указывать на событие HGT. Поскольку построение дерева не требуется, неявные подходы, как правило, проще и быстрее, чем явные методы.
Однако неявные методы могут быть ограничены несоответствием между лежащей в основе правильной филогенией и рассматриваемыми эволюционными расстояниями. Например, наиболее похожая последовательность, полученная при наивысшей оценке ВЗРЫВ хит не всегда является наиболее близким в эволюционном отношении.[77]
Соответствие верхней последовательности у далеких видов
Простой способ определения событий HGT - это поиск совпадений последовательностей с высокими показателями у отдаленно родственных видов. Например, анализ основных совпадений BLAST последовательностей белков в бактериях Thermotoga maritima выявили, что большинство попаданий было в архей, а не в близкородственных бактериях, что предполагает наличие обширного ГПГ между ними;[37] эти предсказания позже были подтверждены анализом структурных особенностей молекулы ДНК.[17]
Однако этот метод ограничен обнаружением относительно недавних событий HGT. Действительно, если HGT произошел в общий предок из двух или более видов, включенных в базу данных, самое близкое попадание будет находиться в этой кладе, и поэтому HGT не будет обнаружен этим методом. Таким образом, пороговое значение минимального количества зарубежных попаданий в топ BLAST, которое необходимо соблюдать для принятия решения о переносе гена, сильно зависит от таксономического охвата баз данных последовательностей. Таким образом, экспериментальные настройки, возможно, придется определять специальным образом.[78]
Несоответствие между расстояниями между генами и видами
В молекулярные часы Гипотеза утверждает, что гомологичные гены эволюционируют примерно с постоянной скоростью у разных видов.[79] Если рассматривать только гомологичные гены, связанные через события видообразования (называемые «ортологичными» генами), лежащее в их основе дерево должно по определению соответствовать дереву видов. Следовательно, принимая молекулярные часы, эволюционное расстояние между ортологичными генами должно быть приблизительно пропорционально эволюционным расстояниям между их соответствующими видами. предполагаемая группа ортологов содержит ксенологи (пары генов, связанных через HGT), пропорциональность эволюционных расстояний может сохраняться только среди ортологов, но не среди ксенологов.[80]
Простые подходы сравнивают распределение оценок сходства определенных последовательностей и их ортологичных аналогов у других видов; HGT выводятся из выбросов.[81][82] Более сложный метод DLIGHT («Вывод горизонтально переносимых генов на основе расстояния») одновременно рассматривает влияние HGT на все последовательности в группах предполагаемых ортологов:[7] если критерий отношения правдоподобия гипотезы HGT по сравнению с гипотезой об отсутствии HGT является значимым, предполагается предполагаемое событие HGT. Кроме того, этот метод позволяет сделать вывод о потенциальных донорах и реципиентах и дает оценку времени, прошедшего с момента ГПГ.
Филогенетические профили
Группа ортологичных или гомологичных генов может быть проанализирована с точки зрения наличия или отсутствия членов группы в эталонных геномах; такие узоры называются филогенетические профили.[83] Чтобы найти события HGT, филогенетические профили сканируются на предмет необычного распределения генов. Отсутствие гомолога у некоторых членов группы близкородственных видов свидетельствует о том, что исследуемый ген мог появиться в результате HGT-события.Например, три факультативно симбиотических Frankia sp. штаммы имеют разительно разные размеры: 5,43 Мбит / с, 7,50 Мбит / с и 9,04 Мбит / с, в зависимости от диапазона их хостов.[84] Было обнаружено, что отмеченные части штамм-специфичных генов не имеют значительного попадания в справочную базу данных и, возможно, были получены путем переноса HGT от других бактерий. Точно так же три фенотипически различных кишечная палочка штаммы (уропатогенный, энтерогеморрагический и доброкачественные) составляют около 40% от общего количества Генофонд при этом остальные 60% являются штамм-специфичными генами и, следовательно, кандидатами на ГПГ.[85] Еще одним свидетельством того, что эти гены возникли в результате HGT, были их резко отличающиеся модели использования кодонов от основных генов и отсутствие сохранение порядка генов (сохранение порядка типично для вертикально эволюционирующих генов).[85] Таким образом, наличие / отсутствие гомологов (или их эффективное количество) может использоваться программами для реконструкции наиболее вероятного сценария эволюции вдоль дерева видов. Так же, как с методы согласования, этого можно добиться с помощью экономных[86] или вероятностная оценка количества событий прибылей и убытков.[87][88] Модели можно усложнять, добавляя процессы, такие как усечение генов,[89] но также путем моделирования неоднородности темпов прироста и убытка по линиям[90] и / или генные семейства.[88][91]
Кластеры полиморфных сайтов
Гены обычно считаются основными единицами, передаваемыми через событие HGT. Однако HGT также может происходить внутри генов. Например, было показано, что горизонтальный перенос между близкородственными видами приводит к большему обмену ORF фрагменты[92][93] тип передачи называется преобразование гена, опосредованная гомологичной рекомбинацией. Анализ группы из четырех человек кишечная палочка и два Шигелла флекснери штаммов выявили, что участки последовательности, общие для всех шести штаммов, содержат полиморфные сайты, последствия гомологичной рекомбинации.[94] Таким образом, кластеры избытка полиморфных сайтов можно использовать для обнаружения треков ДНК, рекомбинированных с дальним родственником.[95] Однако этот метод обнаружения ограничен сайтами, общими для всех анализируемых последовательностей, ограничивая анализ группой тесно связанных организмов.
Оценка
Существование многочисленных и разнообразных методов вывода HGT поднимает вопрос о том, как подтверждать индивидуальные выводы и как сравнивать различные методы.
Основная проблема заключается в том, что, как и в случае с другими типами филогенетических выводов, фактическая эволюционная история не может быть установлена с уверенностью. В результате сложно получить представителя набор тестов событий HGT. Кроме того, методы вывода HGT значительно различаются по информации, которую они рассматривают, и часто выявляют несовместимые группы кандидатов HGT:[6][96] неясно, в какой степени пересечение, то союз, или другая комбинация отдельных методов влияет на ложный положительный результат и ложноотрицательный тарифы.[14]
Параметрические и филогенетические методы опираются на разные источники информации; поэтому трудно делать общие заявления об их относительной эффективности. Однако можно использовать концептуальные аргументы. В то время как параметрические методы ограничиваются анализом одного или пары геномов, филогенетические методы обеспечивают естественную основу для использования информации, содержащейся в нескольких геномах. Во многих случаях сегменты геномов, определяемые как HGT на основании их аномального состава, также могут быть распознаны как таковые на основе филогенетических анализов или по простому отсутствию в геномах родственных организмов. Кроме того, филогенетические методы полагаются на явные модели эволюции последовательностей, которые обеспечивают хорошо понятную основу для вывода параметров, проверки гипотез и выбора модели. Это отражено в литературе, которая склонна отдавать предпочтение филогенетическим методам как стандарту доказательства ГПГ.[97][98][99][100] Таким образом, использование филогенетических методов представляется предпочтительным стандартом, особенно с учетом того, что увеличение вычислительной мощности в сочетании с улучшением алгоритмов сделало их более управляемыми,[63][72] и что все более плотная выборка геномов придает этим тестам больше силы.
Что касается филогенетических методов, было принято несколько подходов к проверке индивидуальных выводов HGT и методов сравнительного анализа, обычно основанных на различных формах симуляция. Поскольку истина известна в моделировании, количество ложных срабатываний и количество ложноотрицательных результатов легко вычислить. Однако моделирование данных не решает проблему тривиально, потому что истинная степень ГПГ в природе остается в значительной степени неизвестной, а определение скорости ГПГ в моделируемой модели всегда затруднительно. Тем не менее, исследования, включающие сравнение нескольких филогенетических методов в рамках моделирования, могут дать количественную оценку их соответствующих характеристик и, таким образом, помочь биологу в выборе объективно подходящих инструментов.[58]
Стандартные инструменты для моделирования эволюции последовательности вдоль деревьев, такие как INDELible[101] или PhyloSim[102] может быть адаптирован для имитации ГПГ. События HGT вызывают конфликт между соответствующими деревьями генов и деревом видов. Такие события HGT могут быть смоделированы путем обрезки поддеревьев и перестановки пересадки дерева видов.[55] Тем не менее, важно моделировать данные, которые достаточно реалистичны, чтобы представлять проблему, создаваемую реальными наборами данных, и поэтому имитация сложных моделей предпочтительнее. Была разработана модель для моделирования деревьев генов с гетерогенными процессами замещения в дополнение к возникновению передачи и с учетом того факта, что передача может происходить уже сейчас. вымерший донорские линии.[103] В качестве альтернативы симулятор эволюции генома ALF[104] непосредственно генерирует семейства генов, подверженные HGT, учитывая целый ряд эволюционных сил на базовом уровне, но в контексте полного генома. Учитывая смоделированные последовательности, которые имеют HGT, анализ этих последовательностей с использованием интересующих методов и сравнение их результатов с известной истиной позволяет изучить их работу. Точно так же тестирование методов на последовательности, заведомо не имеющей HGT, позволяет изучать ложноположительные результаты.
Моделирование событий HGT также может быть выполнено путем манипулирования самими биологическими последовательностями. Искусственный химерные геномы могут быть получены путем вставки известных чужеродных генов в случайные позиции генома хозяина.[12][105][106][107] Донорные последовательности вставляются в хозяина в неизменном виде или могут быть дополнительно модифицированы путем моделирования,[7] например, используя инструменты, описанные выше.
Одним из важных недостатков моделирования как способа оценки различных методов является то, что моделирование основано на сильных упрощающих допущениях, которые могут способствовать определенным методам.[108]
Смотрите также
- Указатель статей по эволюционной биологии
- Горизонтальный перенос генов
- Горизонтальный перенос генов в эволюции
- Филогенетическое дерево
- Филогенетическая сеть
- Биоинформатика
- Сравнительная геномика
- Гомология (биология)
Рекомендации
- ^ Хирамацу К., Цуй Л., Курода М., Ито Т. (октябрь 2001 г.). «Возникновение и эволюция метициллин-устойчивого золотистого стафилококка». Тенденции в микробиологии. 9 (10): 486–93. Дои:10.1016 / s0966-842x (01) 02175-8. PMID 11597450.
- ^ Гриффит Ф (январь 1928 г.). «Значение типов пневмококков». Журнал гигиены. 27 (2): 113–59. Дои:10.1017 / s0022172400031879. ЧВК 2167760. PMID 20474956.
- ^ Татум Е.Л., Ледерберг Дж. (Июнь 1947 г.). «Рекомбинация генов в бактериях Escherichia coli». Журнал бактериологии. 53 (6): 673–84. Дои:10.1128 / JB.53.6.673-684.1947. ЧВК 518375. PMID 16561324.
- ^ Зиндер Н.Д., Ледерберг Дж. (Ноябрь 1952 г.). «Генетический обмен у сальмонелл». Журнал бактериологии. 64 (5): 679–99. Дои:10.1128 / JB.64.5.679-699.1952. ЧВК 169409. PMID 12999698.
- ^ Джонс Д., Сниз PH (март 1970 г.). «Генетический перенос и бактериальная систематика». Бактериологические обзоры. 34 (1): 40–81. Дои:10.1128 / MMBR.34.1.40-81.1970. ЧВК 378348. PMID 4909647.
- ^ а б c Лоуренс Дж. Г., Охман Х (январь 2002 г.). «Согласование многогранности латерального переноса генов». Тенденции в микробиологии. 10 (1): 1–4. Дои:10.1016 / s0966-842x (01) 02282-x. PMID 11755071.
- ^ а б c Дессимоз К., Маргадант Д., Гонне Г.Х. (2008). «DLIGHT - Обнаружение бокового переноса генов с использованием парных эволюционных расстояний в статистической структуре». Исследования в области вычислительной молекулярной биологии. Конспект лекций по информатике. 4955. п. 315. Дои:10.1007/978-3-540-78839-3_27. ISBN 978-3-540-78838-6. S2CID 12776750.
- ^ а б Guindon S, Perrière G (сентябрь 2001 г.). «Внутригеномная вариация базового содержания является потенциальным источником систематических ошибок при поиске горизонтально переносимых генов». Молекулярная биология и эволюция. 18 (9): 1838–40. Дои:10.1093 / oxfordjournals.molbev.a003972. PMID 11504864.
- ^ а б Лоуренс Дж. Г., Охман Х (апрель 1997 г.). «Улучшение бактериальных геномов: темпы изменения и обмена». Журнал молекулярной эволюции. 44 (4): 383–97. Bibcode:1997JMolE..44..383L. CiteSeerX 10.1.1.590.7214. Дои:10.1007 / pl00006158. PMID 9089078. S2CID 7928957.
- ^ а б Азад Р.К., Лоуренс Дж. Г. (май 2011 г.). «К более надежным методам обнаружения чужеродных генов». Исследования нуклеиновых кислот. 39 (9): e56. Дои:10.1093 / nar / gkr059. ЧВК 3089488. PMID 21297116.
- ^ Xiong D, Xiao F, Liu L, Hu K, Tan Y, He S, Gao X (2012). «На пути к лучшему обнаружению горизонтально переносимых генов за счет эффективного сочетания необычных свойств». PLOS ONE. 7 (8): e43126. Bibcode:2012PLoSO ... 743126X. Дои:10.1371 / journal.pone.0043126. ЧВК 3419211. PMID 22905214.
- ^ а б c Бек Дж, Шурло С., Дешаванн П. (апрель 2010 г.). «Тест параметрических методов обнаружения горизонтальных перемещений». PLOS ONE. 5 (4): e9989. Bibcode:2010PLoSO ... 5.9989B. Дои:10.1371 / journal.pone.0009989. ЧВК 2848678. PMID 20376325.
- ^ Попцова М (2009). «Тестирование филогенетических методов для определения горизонтального переноса генов». Горизонтальный перенос генов. Методы молекулярной биологии. 532. С. 227–40. Дои:10.1007/978-1-60327-853-9_13. ISBN 978-1-60327-852-2. PMID 19271188.
- ^ а б Попцова М.С., Гогартен Ю.П. (март 2007 г.). «Сила филогенетических подходов к обнаружению горизонтально переносимых генов». BMC Эволюционная биология. 7: 45. Дои:10.1186/1471-2148-7-45. ЧВК 1847511. PMID 17376230.
- ^ а б c Добин V, Лерат Э, Перрьер G (2003). «Источник латерально переносимых генов в бактериальных геномах». Геномная биология. 4 (9): R57. Дои:10.1186 / gb-2003-4-9-r57. ЧВК 193657. PMID 12952536.
- ^ а б Лоуренс Дж. Г., Охман Х (август 1998 г.). «Молекулярная археология генома Escherichia coli». Труды Национальной академии наук Соединенных Штатов Америки. 95 (16): 9413–7. Bibcode:1998PNAS ... 95.9413L. Дои:10.1073 / пнас.95.16.9413. ЧВК 21352. PMID 9689094.
- ^ а б c d Уорнинг П., Дженсен Л.Дж., Нельсон К.Э., Брунак С., Уссери Д.В. (февраль 2000 г.). «Структурный анализ последовательности ДНК: свидетельство латерального переноса генов у Thermotoga maritima». Исследования нуклеиновых кислот. 28 (3): 706–9. Дои:10.1093 / nar / 28.3.706. ЧВК 102551. PMID 10637321.
- ^ Дешаванн П., Филипски Дж. (Апрель 1995 г.). «Корреляция содержания GC со временем репликации и механизмами восстановления в слабо экспрессируемых генах E.coli». Исследования нуклеиновых кислот. 23 (8): 1350–3. Дои:10.1093 / nar / 23.8.1350. ЧВК 306860. PMID 7753625.
- ^ Wuitschick JD, Karrer KM (1999). «Анализ геномного содержания G + C, использования кодонов, контекста кодонов инициатора и сайтов терминации трансляции у Tetrahymena thermophila». Журнал эукариотической микробиологии. 46 (3): 239–47. Дои:10.1111 / j.1550-7408.1999.tb05120.x. PMID 10377985.
- ^ Рендулич С., Джагтап П., Розинус А., Эппингер М., Баар С., Ланц С. и др. (Январь 2004 г.). «Хищник без маски: жизненный цикл Bdellovibrio bacteriovorus с геномной точки зрения». Наука. 303 (5658): 689–92. Bibcode:2004Научный ... 303..689R. Дои:10.1126 / science.1093027. PMID 14752164. S2CID 38154836.
- ^ Гофна Ю., Шарлебуа Р.Л., Дулиттл В.Ф. (февраль 2006 г.). «Древний латеральный перенос генов в эволюции Bdellovibrio bacteriovorus». Тенденции в микробиологии. 14 (2): 64–9. Дои:10.1016 / j.tim.2005.12.008. PMID 16413191.
- ^ Верникос Г.С., Томсон Н.Р., Паркхилл Дж. (2007). «Генетический поток с течением времени в линии сальмонелл». Геномная биология. 8 (6): R100. Дои:10.1186 / gb-2007-8-6-r100. ЧВК 2394748. PMID 17547764.
- ^ Маккатчеон Дж. П., Моран Н. А. (2010). «Функциональная конвергенция в редуцированных геномах бактериальных симбионтов за 200 млн лет эволюции». Геномная биология и эволюция. 2: 708–18. Дои:10.1093 / gbe / evq055. ЧВК 2953269. PMID 20829280.
- ^ Лю З., Венкатеш СС, Малей СС (октябрь 2008 г.). «Покрытие последовательностей, энтропия геномов и возможность обнаружения нечеловеческой ДНК в образцах человека». BMC Genomics. 9: 509. Дои:10.1186/1471-2164-9-509. ЧВК 2628393. PMID 18973670.
- ^ Бентли SD, Parkhill J (2004). «Сравнительная геномная структура прокариот». Ежегодный обзор генетики. 38: 771–92. Дои:10.1146 / annurev.genet.38.072902.094318. PMID 15568993. S2CID 5524251.
- ^ Карлин С., Бердж С. (июль 1995 г.). «Экстремальные значения относительного обилия динуклеотидов: геномная подпись». Тенденции в генетике. 11 (7): 283–90. Дои:10.1016 / S0168-9525 (00) 89076-9. PMID 7482779.
- ^ Верникос Г.С., Паркхилл Дж. (Сентябрь 2006 г.). «Интерполированные мотивы переменного порядка для идентификации горизонтально полученной ДНК: возвращение к островам патогенности сальмонелл». Биоинформатика. 22 (18): 2196–203. Дои:10.1093 / биоинформатика / btl369. PMID 16837528.
- ^ Хупер С.Д., Берг О.Г. (март 2002 г.). «Выявление генов с атипичной нуклеотидной последовательностью в микробных геномах». Журнал молекулярной эволюции. 54 (3): 365–75. Bibcode:2002JMolE..54..365H. Дои:10.1007 / s00239-001-0051-8. PMID 11847562. S2CID 6872232.
- ^ Дешаванн П.Дж., Жирон А., Вилайн Дж., Фагот Дж., Фертил Б. (октябрь 1999 г.). «Геномная подпись: характеристика и классификация видов, оцениваемая с помощью хаотического игрового представления последовательностей». Молекулярная биология и эволюция. 16 (10): 1391–9. Дои:10.1093 / oxfordjournals.molbev.a026048. PMID 10563018.
- ^ Dufraigne C, Fertil B, Lespinats S, Giron A, Deschavanne P (январь 2005 г.). «Обнаружение и характеристика горизонтальных переносов у прокариот с использованием геномной подписи». Исследования нуклеиновых кислот. 33 (1): e6. Дои:10.1093 / nar / gni004. ЧВК 546175. PMID 15653627.
- ^ Cortez D, Forterre P, Gribaldo S (2009). «Скрытый резервуар интегративных элементов является основным источником недавно приобретенных чужеродных генов и ORF в геномах архей и бактерий». Геномная биология. 10 (6): R65. Дои:10.1186 / gb-2009-10-6-r65. ЧВК 2718499. PMID 19531232.
- ^ Накамура Ю., Ито Т., Мацуда Х., Годжобори Т. (июль 2004 г.). «Смещенные биологические функции горизонтально переносимых генов в геномах прокариот». Природа Генетика. 36 (7): 760–6. Дои:10,1038 / ng1381. PMID 15208628.
- ^ Орнштейн Р.Л., Рейн Р. (октябрь 1978 г.). «Оптимизированная потенциальная функция для расчета энергий взаимодействия нуклеиновых кислот I. Укладка оснований». Биополимеры. 17 (10): 2341–60. Дои:10.1002 / bip.1978.360171005. PMID 24624489.
- ^ эль-Хассан М.А., Калладин С.Р. (май 1996 г.). «Пропеллер-скручивание пар оснований и конформационная подвижность динуклеотидных ступеней в ДНК». Журнал молекулярной биологии. 259 (1): 95–103. Дои:10.1006 / jmbi.1996.0304. PMID 8648652.
- ^ Олсон В.К., Горин А.А., Лу XJ, Хок Л.М., Журкин В.Б. (сентябрь 1998 г.). «Зависимая от последовательности ДНК деформируемость, полученная на основе кристаллических комплексов белок-ДНК». Труды Национальной академии наук Соединенных Штатов Америки. 95 (19): 11163–8. Bibcode:1998PNAS ... 9511163O. Дои:10.1073 / пнас.95.19.11163. ЧВК 21613. PMID 9736707.
- ^ Герцель Х, Вайс О, Трифонов Е.Н. (март 1999 г.). «Периодичность 10-11 п.н. в полных геномах отражает структуру белка и укладку ДНК». Биоинформатика. 15 (3): 187–93. Дои:10.1093 / биоинформатика / 15.3.187. PMID 10222405.
- ^ а б Нельсон К.Е., Клейтон Р.А., Гилл С.Р., Гвинн М.Л., Додсон Р.Дж., Хафт Д.Х. и др. (Май 1999 г.). «Доказательства латерального переноса генов между археями и бактериями из последовательности генома Thermotoga maritima». Природа. 399 (6734): 323–9. Bibcode:1999Натура.399..323Н. Дои:10.1038/20601. PMID 10360571. S2CID 4420157.
- ^ Лангиль М.Г., Сяо В.В., Бринкман Ф.С. (май 2010 г.). «Обнаружение геномных островов с использованием подходов биоинформатики». Обзоры природы. Микробиология. 8 (5): 373–82. Дои:10.1038 / nrmicro2350. PMID 20395967. S2CID 2373228.
- ^ Hacker J, Blum-Oehler G, Mühldorfer I, Tschäpe H (март 1997 г.). «Островки патогенности вирулентных бактерий: структура, функции и влияние на микробную эволюцию». Молекулярная микробиология. 23 (6): 1089–97. Дои:10.1046 / j.1365-2958.1997.3101672.x. PMID 9106201. S2CID 27524815.
- ^ Верникос Г.С., Паркхилл Дж. (Февраль 2008 г.). «Устранение структурных особенностей геномных островов: подход машинного обучения». Геномные исследования. 18 (2): 331–42. Дои:10.1101 / гр.7004508. ЧВК 2203631. PMID 18071028.
- ^ Альтенхофф AM, Дессимоз C (2012). "Вывод ортологии и паралогии" (PDF). Эволюционная геномика. Методы молекулярной биологии. 855. С. 259–79. Дои:10.1007/978-1-61779-582-4_9. ISBN 978-1-61779-581-7. PMID 22407712.
- ^ Тхан С., Рутс Д., Иннан Х., Наклех Л. (май 2007 г.). «Смешивающие факторы в обнаружении HGT: статистическая ошибка, эффекты слияния и множественные решения». Журнал вычислительной биологии. 14 (4): 517–35. CiteSeerX 10.1.1.121.7834. Дои:10.1089 / cmb.2007.A010. PMID 17572027.
- ^ Голдман Н., Андерсон Дж. П., Родриго А.Г. (декабрь 2000 г.). «Правдоподобные тесты топологий в филогенетике». Систематическая биология. 49 (4): 652–70. Дои:10.1080/106351500750049752. PMID 12116432.
- ^ Симодаира Х., Хасегава М. (1999). «Множественные сравнения логарифмических вероятностей с приложениями к филогенетическому выводу». Молекулярная биология и эволюция. 16 (8): 1114–1116. Дои:10.1093 / oxfordjournals.molbev.a026201.
- ^ Шимодаира Х (июнь 2002 г.). «Примерно беспристрастный тест выбора филогенетического дерева». Систематическая биология. 51 (3): 492–508. Дои:10.1080/10635150290069913. PMID 12079646. S2CID 11586099.
- ^ Лерат Э., Добин В., Моран Н.А. (октябрь 2003 г.). «От генных деревьев к организменной филогении у прокариот: на примере гамма-протеобактерий». PLOS Биология. 1 (1): E19. Дои:10.1371 / journal.pbio.0000019. ЧВК 193605. PMID 12975657.
- ^ Жакыбаева О., Хамель Л., Раймонд Дж., Гогартен Дж. П. (2004). «Визуализация филогенетического содержания пяти геномов с помощью декапентагональных карт». Геномная биология. 5 (3): R20. Дои:10.1186 / gb-2004-5-3-r20. ЧВК 395770. PMID 15003123.
- ^ а б Бейко Р.Г., Харлоу Т.Дж., Раган М.А. (октябрь 2005 г.). «Пути обмена генами у прокариот». Труды Национальной академии наук Соединенных Штатов Америки. 102 (40): 14332–7. Bibcode:2005ПНАС..10214332Б. Дои:10.1073 / pnas.0504068102. ЧВК 1242295. PMID 16176988.
- ^ а б c d Boc A, Филипп H, Макаренков V (март 2010 г.). «Выявление и подтверждение событий горизонтального переноса генов с использованием двудольных различий». Систематическая биология. Издательство Оксфордского университета. 59 (2): 195–211. Дои:10.1093 / sysbio / syp103. PMID 20525630.
- ^ Жакыбаева О., Гогартен Дж. П., Шарлебуа Р. Л., Дулиттл В. Ф., Папке Р. Т. (сентябрь 2006 г.). «Филогенетический анализ геномов цианобактерий: количественная оценка событий горизонтального переноса генов». Геномные исследования. 16 (9): 1099–108. Дои:10.1101 / гр. 5322306. ЧВК 1557764. PMID 16899658.
- ^ Бансал М.С., Банай Г., Гогартен Дж. П., Шамир Р. (сентябрь 2011 г.). «Обнаружение магистралей горизонтального переноса генов». Журнал вычислительной биологии. 18 (9): 1087–114. CiteSeerX 10.1.1.418.3658. Дои:10.1089 / cmb.2011.0066. PMID 21899418.
- ^ Bansal MS, Banay G, Harlow TJ, Gogarten JP, Shamir R (март 2013 г.). «Систематический вывод о путях горизонтального переноса генов у прокариот». Биоинформатика. 29 (5): 571–9. Дои:10.1093 / биоинформатика / btt021. PMID 23335015.
- ^ а б Халлетт М.Т., Лагергрен Дж. РЕКОМБ 2001. Монреаль: ACM; 2001. Эффективные алгоритмы для проблем латерального переноса генов; С. 149–156.
- ^ Барони М., Грюневальд С., Моултон В., Семпл С. (август 2005 г.). «Ограничение количества событий гибридизации для последовательной эволюционной истории». Журнал математической биологии. 51 (2): 171–82. Дои:10.1007 / s00285-005-0315-9. HDL:10092/12222. PMID 15868201. S2CID 3180904.
- ^ а б Бейко Р., Гамильтон Н. (февраль 2006 г.). «Филогенетическая идентификация событий латерального генетического переноса». BMC Эволюционная биология. 6: 15. Дои:10.1186/1471-2148-6-15. ЧВК 1431587. PMID 16472400.
- ^ а б c Boc A, Диалло А.Б., Макаренков В. (июль 2012 г.). «T-REX: веб-сервер для вывода, проверки и визуализации филогенетических деревьев и сетей». Исследования нуклеиновых кислот. Издательство Оксфордского университета. 40 (W1): W573-9. Дои:10.1093 / нар / гкс485. ЧВК 3394261. PMID 22675075.
- ^ а б Наклех Л., Рутс Д.А., Ван Л.: RIATA-HGT: быстрая и точная эвристика для реконструкции горизонтальной передачи генов. COCOON, 16–29 августа 2005 г .; Куньмин 2005.
- ^ а б Эбби С.С., Танье Э., Гуи М., Добин В. (июнь 2010 г.). «Обнаружение бокового переноса генов путем статистической сверки филогенетических лесов». BMC Bioinformatics. 11: 324. Дои:10.1186/1471-2105-11-324. ЧВК 2905365. PMID 20550700.
- ^ Hickey G, Dehne F, Rau-Chaplin A, Blouin C (февраль 2008 г.). «Расчет расстояния SPR для некорневых деревьев». Эволюционная биоинформатика в Интернете. 4: 17–27. Дои:10.4137 / ebo.s419. ЧВК 2614206. PMID 19204804.
- ^ Хейн Дж, Цзян Т., Ван Л., Чжан К. (1996). «О сложности сравнения эволюционных деревьев». Дискретная прикладная математика. 71 (1–3): 153–169. Дои:10.1016 / S0166-218X (96) 00062-5.
- ^ Аллен Б.Л., Сталь М (2001). «Операции переноса поддерева и их индуцированные метрики на эволюционных деревьях». Анналы комбинаторики. 5: 1–15. CiteSeerX 10.1.1.24.8389. Дои:10.1007 / s00026-001-8006-8. S2CID 2934442.
- ^ МакЛауд Д., Шарлебуа Р.Л., Дулиттл Ф., Баптест Е. (апрель 2005 г.). «Вычисление вероятных событий латерального переноса генов посредством сравнения филогенетических деревьев путем рекурсивной консолидации и перегруппировки». BMC Эволюционная биология. 5: 27. Дои:10.1186/1471-2148-5-27. ЧВК 1087482. PMID 15819979.
- ^ а б Дойон Дж. П., Хамель С., Чов С. (2012). «Эффективный метод исследования пространства согласований дерева генов / дерева видов в вероятностной структуре» (PDF). IEEE / ACM Transactions по вычислительной биологии и биоинформатике. 9 (1): 26–39. Дои:10.1109 / TCBB.2011.64. PMID 21464510. S2CID 2493991.
- ^ а б Дэвид Л.А., Альм Э.Дж. (январь 2011 г.). «Быстрые эволюционные инновации во время генетической экспансии архей» (PDF). Природа. 469 (7328): 93–6. Bibcode:2011Натура 469 ... 93D. Дои:10.1038 / природа09649. HDL:1721.1/61263. PMID 21170026. S2CID 4420725.
- ^ Szöllosi GJ, Boussau B, Abby SS, Tannier E, Daubin V (октябрь 2012 г.). «Филогенетическое моделирование латерального переноса генов реконструирует образец и относительное время видообразования». Труды Национальной академии наук Соединенных Штатов Америки. 109 (43): 17513–8. Bibcode:2012PNAS..10917513S. Дои:10.1073 / pnas.1202997109. ЧВК 3491530. PMID 23043116.
- ^ Нгуен Т.Х., Ранвез В., Пойнтет С., Шифолло А.М., Дойон Дж. П., Берри В. (апрель 2013 г.). «Примирение и реорганизация местного генного дерева могут принести обоюдную выгоду». Алгоритмы молекулярной биологии. 8 (1): 12. Дои:10.1186/1748-7188-8-12. ЧВК 3871789. PMID 23566548.
- ^ Szöllosi GJ, Tannier E, Lartillot N, Daubin V (май 2013 г.). «Боковой перенос генов от мертвых». Систематическая биология. 62 (3): 386–97. arXiv:1211.4606. Дои:10.1093 / sysbio / syt003. ЧВК 3622898. PMID 23355531.
- ^ Бансал М.С., Альм Э.Дж., Келлис М. (июнь 2012 г.). «Эффективные алгоритмы решения проблемы примирения с дупликацией генов, горизонтальным переносом и потерей». Биоинформатика. 28 (12): i283-91. Дои:10.1093 / биоинформатика / bts225. ЧВК 3371857. PMID 22689773.
- ^ Маевски Дж., Завадски П., Пикерилл П., Кохан Ф. М., Доусон К. Г. (февраль 2000 г.). «Барьеры для генетического обмена между видами бактерий: трансформация Streptococcus pneumoniae». Журнал бактериологии. 182 (4): 1016–23. Дои:10.1128 / jb.182.4.1016-1023.2000. ЧВК 94378. PMID 10648528.
- ^ Sjöstrand J, Tofigh A, Daubin V, Arvestad L, Sennblad B, Lagergren J (май 2014 г.). «Байесовский метод анализа латерального переноса генов». Систематическая биология. 63 (3): 409–20. Дои:10.1093 / sysbio / syu007. PMID 24562812.
- ^ а б Szöllõsi GJ, Rosikiewicz W, Boussau B, Tannier E, Daubin V (ноябрь 2013 г.). «Эффективное исследование пространства согласованных генных деревьев». Систематическая биология. 62 (6): 901–12. arXiv:1306.2167. Bibcode:2013arXiv1306.2167S. Дои:10.1093 / sysbio / syt054. ЧВК 3797637. PMID 23925510.
- ^ Haggerty LS, Jachiet PA, Hanage WP, Fitzpatrick DA, Lopez P, O'Connell MJ и др. (Март 2014 г.). «Плюралистический учет гомологии: адаптация моделей к данным». Молекулярная биология и эволюция. 31 (3): 501–16. Дои:10.1093 / molbev / mst228. ЧВК 3935183. PMID 24273322.
- ^ Szöllsi GJ, Tannier E, Daubin V, Boussau B (январь 2015 г.). «Заключение генных деревьев с деревьями видов». Систематическая биология. 64 (1): e42-62. Дои:10.1093 / sysbio / syu048. ЧВК 4265139. PMID 25070970.
- ^ Lassalle F, Planel R, Penel S, Chapulliot D, Barbe V, Dubost A и др. (Декабрь 2017 г.). «Оценка генома предков раскрывает историю экологической диверсификации Agrobacterium». Геномная биология и эволюция. 9 (12): 3413–3431. Дои:10.1093 / gbe / evx255. ЧВК 5739047. PMID 29220487.
- ^ Дюшемин В., Ансельметти Ю., Паттерсон М., Понти И., Берар С., Чов С. и др. (Май 2017). «DeCoSTAR: реконструкция предковой организации генов или геномов с использованием согласованных филогений». Геномная биология и эволюция. 9 (5): 1312–1319. Дои:10.1093 / gbe / evx069. ЧВК 5441342. PMID 28402423.
- ^ Koski LB, Golding GB (июнь 2001 г.). «Ближайшее попадание BLAST часто не является ближайшим соседом». Журнал молекулярной эволюции. 52 (6): 540–2. Bibcode:2001JMolE..52..540K. Дои:10.1007 / s002390010184. PMID 11443357. S2CID 24848333.
- ^ Wisniewski-Dyé F, Borziak K, Khalsa-Moyers G, Alexandre G, Sukharnikov LO, Wuichet K, et al. (Декабрь 2011 г.). Ричардсон П.М. (ред.). «Геномы азоспирилл выявляют переход бактерий из водной среды в наземную». PLOS Genetics. 7 (12): e1002430. Дои:10.1371 / journal.pgen.1002430. ЧВК 3245306. PMID 22216014.
- ^ Цукеркандл, Э. и Полинг, Л. 1965. Эволюционная дивергенция и конвергенция белков. В Bryson, V. и Vogel, H.J. (редакторы). Развивающиеся гены и белки. Academic Press, Нью-Йорк. С. 97–166.
- ^ Новичков П.С., Омельченко М.В., Гельфанд М.С., Миронов А.А., Вольф Ю.И., Кунин Е.В. (октябрь 2004 г.). «Полногеномные молекулярные часы и горизонтальный перенос генов в бактериальной эволюции». Журнал бактериологии. 186 (19): 6575–85. Дои:10.1128 / JB.186.19.6575-6585.2004. ЧВК 516599. PMID 15375139.
- ^ Лоуренс Дж. Г., Хартл Д. Л. (июль 1992 г.). «Заключение горизонтального генетического переноса из молекулярных данных: подход, использующий бутстрап». Генетика. 131 (3): 753–60. ЧВК 1205046. PMID 1628816.
- ^ Кларк Г.Д., Бейко Р.Г., Раган М.А., Шарлебуа Р.Л. (апрель 2002 г.). «Выведение геномных деревьев с помощью фильтра для исключения филогенетически противоречивых последовательностей и матрицы расстояний на основе средних нормализованных баллов BLASTP». Журнал бактериологии. 184 (8): 2072–80. Дои:10.1128 / jb.184.8.2072-2080.2002. ЧВК 134965. PMID 11914337.
- ^ Пеллегрини М., Маркотт Е.М., Томпсон М.Дж., Айзенберг Д., Йейтс Т.О. (апрель 1999 г.). «Назначение функций белков с помощью сравнительного анализа генома: филогенетические профили белков». Труды Национальной академии наук Соединенных Штатов Америки. 96 (8): 4285–8. Bibcode:1999ПНАС ... 96.4285П. Дои:10.1073 / пнас.96.8.4285. ЧВК 16324. PMID 10200254.
- ^ Normand P, Lapierre P, Tisa LS, Gogarten JP, Alloisio N, Bagnarol E, et al. (Январь 2007 г.). «Геномные характеристики факультативно симбиотических штаммов Frankia sp. Отражают круг хозяев и биогеографию растения-хозяина». Геномные исследования. 17 (1): 7–15. Дои:10.1101 / гр.5798407. ЧВК 1716269. PMID 17151343.
- ^ а б Уэлч Р.А., Берланд В., Планкетт Г., Редфорд П., Рош П., Раско Д. и др. (Декабрь 2002 г.). «Обширная мозаичная структура, выявленная полной последовательностью генома уропатогенной Escherichia coli». Труды Национальной академии наук Соединенных Штатов Америки. 99 (26): 17020–4. Bibcode:2002PNAS ... 9917020W. Дои:10.1073 / pnas.252529799. ЧВК 139262. PMID 12471157.
- ^ Csűrös MS (2008). «Реконструкция предков с помощью асимметричной экономии Вагнера по непрерывным символам и квадратной экономии по распределениям». Сравнительная геномика. Конспект лекций по информатике. 5267. С. 72–86. Дои:10.1007/978-3-540-87989-3_6. ISBN 978-3-540-87988-6.
- ^ Пагель М (октябрь 1999 г.). «Вывод исторических закономерностей биологической эволюции». Природа. 401 (6756): 877–84. Bibcode:1999Натура.401..877П. Дои:10.1038/44766. HDL:2027.42/148253. PMID 10553904. S2CID 205034365.
- ^ а б Чурош М., Миклош И. (сентябрь 2009 г.). «Оптимизация и большие наследственные геномы в архее, выведенные с помощью филогенетической модели рождения и смерти». Молекулярная биология и эволюция. 26 (9): 2087–95. Дои:10.1093 / молбев / msp123. ЧВК 2726834. PMID 19570746.
- ^ Хао В., Голдинг, Великобритания (сентябрь 2010 г.). «Выявление потока бактериального генома с учетом усеченных генов». Генетика. 186 (1): 411–26. Дои:10.1534 / генетика.110.118448. ЧВК 2940306. PMID 20551435.
- ^ Хао В., Голдинг, Великобритания (май 2006 г.). «Судьба латерально переданных генов: жизнь по быстрому пути к адаптации или смерти». Геномные исследования. 16 (5): 636–43. Дои:10.1101 / гр.4746406. ЧВК 1457040. PMID 16651664.
- ^ Хао В., Голдинг, Великобритания (май 2008 г.). «Выявление вариаций скорости латерального переноса генов во время эволюции бактериального генома». BMC Genomics. 9: 235. Дои:10.1186/1471-2164-9-235. ЧВК 2426709. PMID 18492275.
- ^ Охман Х., Лоуренс Дж. Г., Гройсман Э. А. (май 2000 г.). «Боковой перенос генов и природа бактериальных инноваций». Природа. 405 (6784): 299–304. Bibcode:2000Натура.405..299O. Дои:10.1038/35012500. PMID 10830951. S2CID 85739173.
- ^ Папке Р.Т., Кениг Дж. Э., Родригес-Валера Ф., Дулиттл В. Ф. (декабрь 2004 г.). «Частая рекомбинация в популяции солеварни Halorubrum». Наука. 306 (5703): 1928–9. Bibcode:2004Научный ... 306.1928П. Дои:10.1126 / science.1103289. PMID 15591201. S2CID 21595153.
- ^ Мау Б., Гласнер Д.Д., Дарлинг А.Е., Перна Н.Т. (2006). «Полногеномное обнаружение и анализ гомологичной рекомбинации среди секвенированных штаммов Escherichia coli». Геномная биология. 7 (5): R44. Дои:10.1186 / gb-2006-7-5-r44. ЧВК 1779527. PMID 16737554.
- ^ Диделот X, Фалуш Д. (март 2007 г.). «Вывод бактериальной микроэволюции с использованием данных мультилокусной последовательности». Генетика. 175 (3): 1251–66. Дои:10.1534 / генетика.106.063305. ЧВК 1840087. PMID 17151252.
- ^ Раган М.А. (июль 2001 г.). «О суррогатных методах выявления латерального переноса генов». Письма о микробиологии FEMS. 201 (2): 187–91. Дои:10.1111 / j.1574-6968.2001.tb10755.x. PMID 11470360.
- ^ Раган М.А., Харлоу Т.Дж., Бейко Р.Г. (январь 2006 г.). «Обнаруживают ли различные суррогатные методы события латеральной передачи генетического материала разного относительного возраста?». Тенденции в микробиологии. 14 (1): 4–8. Дои:10.1016 / j.tim.2005.11.004. PMID 16356716.
- ^ Кечрис К.Дж., Лин Дж.С., Бикель П.Дж., Глейзер А.Н. (июнь 2006 г.). «Количественное исследование возникновения латерального переноса генов с использованием генов фиксации азота в качестве примера». Труды Национальной академии наук Соединенных Штатов Америки. 103 (25): 9584–9. Bibcode:2006PNAS..103.9584K. Дои:10.1073 / pnas.0603534103. ЧВК 1480450. PMID 16769896.
- ^ Моран Н.А., Ярвик Т. (апрель 2010 г.). «Боковой перенос генов от грибов лежит в основе продукции каротиноидов у тлей». Наука. 328 (5978): 624–7. Bibcode:2010Sci ... 328..624M. Дои:10.1126 / science.1187113. PMID 20431015. S2CID 14785276.
- ^ Данчин Э.Г., Россо М.Н., Виейра П., де Алмейда-Энглер Дж., Коутинью П.М., Хенриссат Б., Абад П. (октябрь 2010 г.). «Множественные латеральные переносы генов и дупликации способствовали способности нематод к паразитизму растений». Труды Национальной академии наук Соединенных Штатов Америки. 107 (41): 17651–6. Bibcode:2010PNAS..10717651D. Дои:10.1073 / pnas.1008486107. ЧВК 2955110. PMID 20876108.
- ^ Флетчер В., Ян З. (август 2009 г.). «INDELible: гибкий симулятор эволюции биологической последовательности». Молекулярная биология и эволюция. 26 (8): 1879–88. Дои:10.1093 / molbev / msp098. ЧВК 2712615. PMID 19423664.
- ^ Сипос Б., Массингем Т., Джордан Г.Е., Голдман Н. (апрель 2011 г.). «PhyloSim - Моделирование эволюции последовательностей методом Монте-Карло в среде статистических вычислений R». BMC Bioinformatics. 12: 104. Дои:10.1186/1471-2105-12-104. ЧВК 3102636. PMID 21504561.
- ^ Galtier N (август 2007 г.). «Модель горизонтального переноса генов и проблема бактериальной филогении». Систематическая биология. 56 (4): 633–42. Дои:10.1080/10635150701546231. PMID 17661231.
- ^ Далькен Д.А., Анисимова М., Гонне Г.Х., Дессимоз С. (апрель 2012 г.). «ALF - симулятор эволюции генома». Молекулярная биология и эволюция. 29 (4): 1115–23. Дои:10.1093 / molbev / msr268. ЧВК 3341827. PMID 22160766.
- ^ Cortez DQ, Lazcano A, Becerra A (2005). «Сравнительный анализ методологий обнаружения горизонтально переносимых генов: переоценка марковских моделей первого порядка». В биологии Silico. 5 (5–6): 581–92. PMID 16610135.
- ^ Циригос А., Ригуцос I (2005). «Новый вычислительный метод для обнаружения событий горизонтального переноса генов». Исследования нуклеиновых кислот. 33 (3): 922–33. Дои:10.1093 / нар / gki187. ЧВК 549390. PMID 15716310.
- ^ Азад Р.К., Лоуренс Дж. Г. (ноябрь 2005 г.). «Использование искусственных геномов в оценке методов обнаружения атипичных генов». PLOS вычислительная биология. 1 (6): e56. Bibcode:2005PLSCB ... 1 ... 56A. Дои:10.1371 / journal.pcbi.0010056. ЧВК 1282332. PMID 16292353.
- ^ Янторно С., Гори К., Гольдман Н., Гил М., Дессимоз С. (2014). «Кто наблюдает за хранителями? Оценка критериев для множественного выравнивания последовательности». Методы совмещения нескольких последовательностей. Методы молекулярной биологии. 1079. С. 59–73. arXiv:1211.2160. Дои:10.1007/978-1-62703-646-7_4. ISBN 978-1-62703-645-0. PMID 24170395. S2CID 2363657.