Предвзятость использования кодонов - Codon usage bias

Смещение использования кодонов в Physcomitrella patens

Предвзятость использования кодонов относится к различиям в частоте появления синоним кодоны в кодирующая ДНК. Кодон - это серия из трех нуклеотиды (триплет), который кодирует определенный аминокислота остаток в полипептид цепочка или для прекращения перевод (стоп-кодоны ).

Существует 64 различных кодона (61 кодон, кодирующий аминокислоты, и 3 стоп-кодона), но только 20 различных транслируемых аминокислот. Переизбыток числа кодонов позволяет кодировать многие аминокислоты более чем одним кодоном. Из-за такой избыточности говорят, что генетический код является вырожденным. Генетические коды разных организмов часто смещены в сторону использования одного из нескольких кодонов, которые кодируют одну и ту же аминокислоту по сравнению с другими, то есть будет обнаружена более высокая частота одного, чем ожидалось случайно. Как возникают такие предубеждения - это очень обсуждаемая область молекулярная эволюция. Таблицы использования кодонов, детализирующие систематическую ошибку использования геномных кодонов для организмов в GenBank и RefSeq можно найти в Проект таблиц использования кодонов HIVE (HIVE-CUTs),[1] который содержит две отдельные базы данных, CoCoPUTs и TissueCoCoPUTs. Вместе эти две базы данных предоставляют исчерпывающую, актуальную статистику использования кодонов, пар кодонов и динуклеотидов для всех организмов с доступной информацией о последовательностях и 52 тканях человека, соответственно.[2][3]

Общепризнанно, что смещения кодонов отражают баланс между смещениями мутаций и естественный отбор (баланс мутации и отбора ) для переводческой оптимизации. Оптимальные кодоны у быстрорастущих микроорганизмов, таких как кишечная палочка или же Saccharomyces cerevisiae (пекарские дрожжи) отражают состав соответствующих геномных переносить РНК (тРНК) пул.[4] Считается, что оптимальные кодоны помогают достичь более высокой скорости перевода и высокой точности. В результате этих факторов ожидается, что трансляционный отбор будет сильнее в экспрессированные гены, как и в случае с вышеупомянутыми организмами.[5][6] У других организмов, которые не демонстрируют высоких темпов роста или которые имеют небольшие геномы, оптимизация использования кодонов обычно отсутствует, и предпочтения кодонов определяются характерными мутационными искажениями, наблюдаемыми в этом конкретном геноме. Примеры этого: Homo sapiens (человек) и Helicobacter pylori.[7][8] Организмы, демонстрирующие средний уровень оптимизации использования кодонов, включают: Drosophila melanogaster (плодовая муха), Caenorhabditis elegans (нематода червь ), Стронгилоцентротус пурпуратус (морской еж ), и Arabidopsis thaliana (тале кресс ).[9] Несколько вирусных семейств (герпесвирус, лентивирус, папилломавирус, полиомавирус, аденовирус, и парвовирус ), как известно, кодируют структурные белки которые демонстрируют сильно искаженное использование кодонов по сравнению с клетка-хозяин. Было высказано предположение, что эти смещения кодонов играют роль во временной регуляции их поздних белков.[10]

Природа оптимизации использования кодонов с помощью тРНК является предметом ожесточенных споров. Неясно, влияет ли использование кодонов на эволюцию тРНК или наоборот. Была разработана по крайней мере одна математическая модель, в которой как использование кодонов, так и экспрессия тРНК эволюционируют совместно в Обратная связь мода (т.е., кодоны, уже присутствующие на высоких частотах, стимулируют экспрессию соответствующих им тРНК, а тРНК, обычно экспрессируемые на высоких уровнях, повышают частоту своих соответствующих кодонов). Однако эта модель, похоже, еще не получила экспериментального подтверждения. Другая проблема заключается в том, что эволюция генов тРНК была очень неактивной областью исследований.[нужна цитата ]

Способствующие факторы

Было предложено, чтобы различные факторы были связаны с систематической ошибкой использования кодонов, включая уровень экспрессии генов (отражающий выбор для оптимизации процесса трансляции по количеству тРНК), содержание гуанин-цитозина (Содержимое GC, отражающее горизонтальный перенос генов или мутационная предвзятость), перекос гуанин-цитозин (Перекос GC, отражающий специфическое для цепи мутационное смещение), сохранение аминокислот, белковая гидропатия, транскрипционный отбор, стабильность РНК, оптимальная температура роста, гиперсоленая адаптация и пищевой азот.[11][12][13][14][15][16]

Эволюционные теории

Мутационная предвзятость против отбора

Хотя механизм выбора смещения кодонов остается спорным, возможные объяснения этого смещения делятся на две общие категории. Одно объяснение вращается вокруг теория отбора, в котором смещение кодонов способствует эффективности и / или точности экспрессии белка и, следовательно, подвергается положительный выбор. Модель селекциониста также объясняет, почему более частые кодоны распознаются более многочисленными молекулами тРНК, а также корреляцию между предпочтительными кодонами, уровнями тРНК и количество копий гена. Хотя было показано, что скорость включения аминокислот в более частые кодоны происходит с гораздо большей скоростью, чем у редких кодонов, не было показано, что скорость трансляции напрямую влияет и, следовательно, смещение в сторону более частых кодонов может не быть прямо выгодным. Однако увеличение скорости удлинения трансляции может быть косвенным преимуществом за счет увеличения клеточной концентрации свободных рибосомы и, возможно, скорость начала информационные РНК (мРНК).[17]

Второе объяснение использования кодонов можно объяснить следующим образом: мутационная предвзятость, теория, которая утверждает, что смещение кодонов существует из-за неслучайности мутационных паттернов. Другими словами, некоторые кодоны могут подвергаться большему количеству изменений и, следовательно, приводить к более низким частотам равновесия, также известным как «редкие» кодоны. Различные организмы также демонстрируют разные мутационные смещения, и появляется все больше свидетельств того, что уровень содержания GC по всему геному является наиболее значимым параметром в объяснении различий смещения кодонов между организмами. Дополнительные исследования продемонстрировали, что смещения кодонов можно статистически предсказать в прокариоты используя только межгенные последовательности, выступая против идеи избирательных сил на кодирующие области и дальнейшая поддержка модели смещения мутаций. Однако сама по себе эта модель не может полностью объяснить, почему предпочтительные кодоны распознаются более многочисленными тРНК.[17]

Модель баланса выбора-мутации-дрейфа

Чтобы согласовать свидетельства обоих мутационное давление и отбора, преобладающая гипотеза о смещении кодонов может быть объяснена модель баланса мутации-отбора-дрейфа. Эта гипотеза утверждает, что отбор предпочитает основные кодоны второстепенным кодонам, но второстепенные кодоны могут сохраняться из-за давления мутации и генетический дрейф. Это также предполагает, что отбор, как правило, слабый, но что интенсивность отбора масштабируется до более высокой экспрессии и более функциональных ограничений кодирующих последовательностей.[17]

Последствия кодонного состава

Влияние на вторичную структуру РНК

Потому что вторичная структура из 5 ’конец мРНК влияет на эффективность трансляции, синонимичные изменения в этой области мРНК могут привести к глубокому влиянию на экспрессию генов. Использование кодонов в некодирующая ДНК поэтому области могут играть важную роль во вторичной структуре РНК и последующей экспрессии белков, которые могут подвергаться дальнейшему селективному давлению. В частности, сильная вторичная структура на сайт связывания рибосомы или же кодон инициации может ингибировать трансляцию, а сворачивание мРНК на 5’-конце вызывает большое количество вариаций в уровнях белка.[18]

Влияние на транскрипцию или экспрессию генов

Гетерологичная экспрессия гена используется во многих биотехнологических приложениях, включая производство белка и метаболическая инженерия. Поскольку пулы тРНК различаются у разных организмов, скорость транскрипция и трансляция конкретной кодирующей последовательности может быть менее эффективной при размещении в неродном контексте. Для чрезмерно выраженного трансген, соответствующая мРНК составляет большой процент от общей клеточной РНК, и наличие редких кодонов вдоль стенограмма может привести к неэффективному использованию и истощению рибосом и в конечном итоге снизить уровень продукции гетерологичного белка. Кроме того, состав гена (например, общее количество редких кодонов и наличие следующих друг за другом редких кодонов) также может влиять на точность перевода.[19][20] Однако использование кодонов, оптимизированных для пулов тРНК в конкретном хозяине для сверхэкспрессии гетерологичного гена, также может вызвать аминокислотное голодание и изменить равновесие пулов тРНК. Этот метод корректировки кодонов для соответствия содержанию тРНК хозяина, называемый оптимизация кодонов, традиционно использовался для экспрессии гетерологичного гена. Однако новые стратегии оптимизации гетерологичной экспрессии учитывают глобальное содержание нуклеотидов, такое как локальная сворачивание мРНК, смещение пар кодонов, линейное изменение кодонов, гармонизация кодонов или корреляции кодонов.[21][22] С количеством внесенных изменений нуклеотидов, искусственный синтез генов часто бывает необходимо для создания такого оптимизированного гена.

Смещение специализированных кодонов также наблюдается в некоторых эндогенный гены, например, участвующие в аминокислотном голодании. Например, аминокислотный биосинтетический ферменты преимущественно используют кодоны, которые плохо адаптированы к нормальному содержанию тРНК, но имеют кодоны, адаптированные к пулам тРНК в условиях голодания. Таким образом, использование кодонов может ввести дополнительный уровень регуляции транскрипции для соответствующей экспрессии генов в определенных клеточных условиях.[22]

Влияние на скорость удлинения перевода

Вообще говоря, для генов с высокой экспрессией скорость элонгации трансляции выше по транскриптам с более высокой адаптацией кодонов к пулам тРНК и медленнее по транскриптам с редкими кодонами. Эта корреляция между скоростями трансляции кодонов и концентрациями родственных тРНК обеспечивает дополнительную модуляцию скорости удлинения трансляции, что может дать организму ряд преимуществ. В частности, использование кодонов может позволить глобальное регулирование этих скоростей, а редкие кодоны могут способствовать точности трансляции за счет скорости.[23]

Влияние на сворачивание белков

Сворачивание белков in vivo является векторный, так что N-конец белка покидает транслирующую рибосому и подвергается воздействию растворителя до того, как C-терминал регионы. В результате ко-трансляционный сворачивание белка вводит несколько пространственных и временных ограничений на растущую полипептидную цепь в ее траектории сворачивания. Поскольку скорости трансляции мРНК связаны с укладкой белка, а адаптация кодонов связана с удлинением трансляции, была выдвинута гипотеза, что манипуляции на уровне последовательности могут быть эффективной стратегией для регулирования или улучшения укладки белка. Несколько исследований показали, что приостановка трансляции в результате локальной структуры мРНК происходит для определенных белков, что может быть необходимо для правильной укладки. Более того, синонимичные мутации было показано, что они оказывают существенное влияние на процесс сворачивания растущего белка и могут даже изменять субстратную специфичность ферментов. Эти исследования показывают, что использование кодонов влияет на скорость, с которой полипептиды возникают векторно из рибосомы, что может дополнительно влиять на пути сворачивания белков во всем доступном структурном пространстве.[23]

Методы анализа

В области биоинформатика и вычислительная биология было предложено и использовано множество статистических методов для анализа систематической ошибки использования кодонов.[24] Такие методы, как «частота оптимальных кодонов» (Fop),[25] относительная адаптация кодонов (RCA)[26] или индекс адаптации кодонов (CAI)[27] используются для прогнозирования уровней экспрессии генов, в то время как такие методы, как 'эффективное количество кодонов '(Nc) и Энтропия Шеннона из теория информации используются для измерения равномерности использования кодонов.[28] Многомерные статистические методы, такие как анализ корреспонденции и Анализ главных компонентов, широко используются для анализа вариаций использования кодонов в генах.[29] Существует множество компьютерных программ для выполнения перечисленных выше статистических анализов, в том числе CodonW, GCUA, INCA и т. Д. Оптимизация кодонов применяется при разработке синтетических генов и ДНК-вакцины. Для этой цели в Интернете доступно несколько пакетов программного обеспечения (см. Внешние ссылки).

Рекомендации

  1. ^ Этей, Джон; Алексаки, Айкатерини; Осипова, Екатерина; Ростовцев Александр; Сантана-Кинтеро, Луис В .; Катнени, Упендра; Симонян, Ваган; Кимчи-Сарфати, Хава (02.09.2017). «Новый и обновленный ресурс для таблиц использования кодонов». BMC Bioinformatics. 18 (391): 391. Дои:10.1186 / s12859-017-1793-7. ЧВК  5581930. PMID  28865429.
  2. ^ Алексаки, Айкатерини; Камес, Джейкоб; Холкомб, Дэвид Д.; Этей, Джон; Сантана-Кинтеро, Луис В .; Лам, Фук Вин Нгуен; Хамасаки-Катагири, Нобуко; Осипова, Екатерина; Симонян, Ваган; Бар, Хаим; Комар, Антон А .; Кимчи-Сарфати, Хава (июнь 2019 г.). «Таблицы использования кодонов и пар кодонов (CoCoPUT): Содействие анализу генетических вариаций и дизайну рекомбинантных генов». Журнал молекулярной биологии. 431 (13): 2434–2441. Дои:10.1016 / j.jmb.2019.04.021. PMID  31029701.
  3. ^ Камес, Джейкоб; Алексаки, Айкатерини; Холкомб, Дэвид Д.; Сантана-Кинтеро, Луис В .; Этей, Джон С.; Хамасаки-Катагири, Нобуко; Катнени, Упендра; Голиков, Антон; Ibla, Juan C .; Бар, Хаим; Кимчи-Сарфати, Хава (январь 2020 г.). «TissueCoCoPUTs: новые таблицы использования человеческих тканеспецифических кодонов и пар кодонов, основанные на дифференциальной экспрессии тканевых генов». Журнал молекулярной биологии. 432 (11): 3369–3378. Дои:10.1016 / j.jmb.2020.01.011. PMID  31982380.
  4. ^ Дун, Хэнцзян; Нильссон, Ларс; Курланд, Чарльз Г. (1996). "Ко-вариации обилия тРНК и использования кодонов в кишечная палочка с разными темпами роста ». Журнал молекулярной биологии. 260 (5): 649–663. Дои:10.1006 / jmbi.1996.0428. ISSN  0022-2836. PMID  8709146.
  5. ^ Шарп, Пол М .; Стенико, Микеле; Педен, Джон Ф .; Ллойд, Эндрю Т. (1993). «Использование кодонов: мутационная ошибка, трансляционный отбор или и то, и другое?». Biochem. Soc. Транс. 21 (4): 835–841. Дои:10.1042 / bst0210835. PMID  8132077. S2CID  8582630.
  6. ^ Каная, Шигехико; Ямада, Юко; Кудо, Йошихиро; Икемура, Тошимичи (1999). "Исследования использования кодонов и генов тРНК 18 одноклеточных организмов и количественная оценка Bacillus subtilis тРНК: уровень экспрессии генов и видоспецифическое разнообразие использования кодонов на основе многомерного анализа ». Ген. 238 (1): 143–155. Дои:10.1016 / s0378-1119 (99) 00225-5. ISSN  0378-1119. PMID  10570992.
  7. ^ Атертон, Джон С .; Шарп, Пол М .; Лафай, Бенедикт (1 апреля 2000 г.). «Отсутствие систематической ошибки использования синонимичных кодонов, выбранных трансляционно, у Helicobacter pylori». Микробиология. 146 (4): 851–860. Дои:10.1099/00221287-146-4-851. ISSN  1350-0872. PMID  10784043.
  8. ^ Борнелёв, Сюзанна; Селми, Томмазо; Флад, София; Дитманн, Сабина; Фрай, Микаэла (07.06.2019). «Оптимизация использования кодонов в плюрипотентных эмбриональных стволовых клетках». Геномная биология. 20 (1): 119. Дои:10.1186 / s13059-019-1726-z. ISSN  1474-760X. ЧВК  6555954. PMID  31174582.
  9. ^ Дюре, Лоран (2000). "Количество генов тРНК и использование кодонов в C. elegans геномы адаптированы для оптимальной трансляции высокоэкспрессируемых генов ». Тенденции в генетике. 16 (7): 287–289. Дои:10.1016 / s0168-9525 (00) 02041-2. ISSN  0168-9525. PMID  10858656.
  10. ^ Шин, Янг С .; Бишоф, Георг Ф .; Лауэр, Уильям А .; Дерозье, Рональд К. (10 сентября 2015 г.). «Важность использования кодонов для временной регуляции экспрессии вирусных генов». Труды Национальной академии наук. 112 (45): 14030–14035. Bibcode:2015ПНАС..11214030С. Дои:10.1073 / pnas.1515387112. ЧВК  4653223. PMID  26504241.
  11. ^ Ермолаева М.Д. (октябрь 2001 г.). «Использование синонимичных кодонов у бактерий». Curr Issues Mol Biol. 3 (4): 91–7. PMID  11719972.
  12. ^ Линн DJ, Певец GA, Хики Д.А. (октябрь 2002 г.). «Использование синонимичного кодона подлежит отбору у термофильных бактерий». Нуклеиновые кислоты Res. 30 (19): 4272–7. Дои:10.1093 / нар / gkf546. ЧВК  140546. PMID  12364606.
  13. ^ Пол S, Сумка SK, Das S, Harvill ET, Dutta C (2008). «Молекулярная подпись гиперсоленой адаптации: выводы из генома и протеомного состава галофильных прокариот». Геном Биол. 9 (4): R70. Дои:10.1186 / gb-2008-9-4-r70. ЧВК  2643941. PMID  18397532.
  14. ^ Кобер, К. М .; Погсон, Г. Х. (2013). "Общегеномные паттерны кодонного смещения формируются естественным отбором у пурпурного морского ежа Strongylocentrotus purpuratus". G3. 3 (7): 1069–1083. Дои:10.1534 / g3.113.005769. ЧВК  3704236. PMID  23637123.
  15. ^ Макинерни, Джеймс О. (1 сентября 1998 г.). «Репликационный и транскрипционный отбор по использованию кодонов у Borrelia burgdorferi». Труды Национальной академии наук. 95 (18): 10698–10703. Bibcode:1998ПНАС ... 9510698М. Дои:10.1073 / пнас.95.18.10698. ISSN  0027-8424. ЧВК  27958. PMID  9724767.
  16. ^ Сьюард, Эмили; Келли, Стив (2016). «Диетический азот изменяет смещение кодонов и состав генома у паразитических микроорганизмов». Геномная биология. 17 (226): 3–15. Дои:10.1186 / s13059-016-1087-9. ЧВК  5109750. PMID  27842572.
  17. ^ а б c Hershberg, R; Петров, Д. А. (2008). «Отбор по смещению кодонов». Ежегодный обзор генетики. 42: 287–99. Дои:10.1146 / annurev.genet.42.110807.091442. PMID  18983258. S2CID  7085012.
  18. ^ Novoa, E.M .; Рибас Де Пуплана, L (2012). «Ускорение с контролем: использование кодонов, тРНК и рибосомы». Тенденции в генетике. 28 (11): 574–81. Дои:10.1016 / j.tig.2012.07.006. PMID  22921354.
  19. ^ Shu, P .; Dai, H .; Gao, W .; Гольдман, Э. (2006). «Ингибирование трансляции последовательными редкими кодонами лейцина в E. coli: отсутствие эффекта различной стабильности мРНК». Джин Экспр. 13 (2): 97–106. Дои:10.3727/000000006783991881. ЧВК  6032470. PMID  17017124.CS1 maint: использует параметр авторов (ссылка на сайт)
  20. ^ Correddu, D .; Монтаньо Лопес, J. d. J .; Angermayr, S.A .; Middleditch, M. J .; Пейн, Л. С .; Люнг, И. К. Х. (2019). «Влияние последовательных редких кодонов на рекомбинантную продукцию белков человека в Escherichia coli». IUBMB Life. 72 (2): 266–274. Дои:10.1002 / iub.2162. PMID  31509345.CS1 maint: использует параметр авторов (ссылка на сайт)
  21. ^ Mignon, C .; Mariano, N .; Stadthagen, G .; Лугари, А .; Lagoutte, P .; Доннат, С .; Chenavas, S .; Perot, C .; Sodoyer, R .; Верле, Б. (2018). «Гармонизация кодонов - выход за пределы скорости экспрессии белка». Письма FEBS. 592 (9): 1554–1564. Дои:10.1002/1873-3468.13046. PMID  29624661.CS1 maint: использует параметр авторов (ссылка на сайт)
  22. ^ а б Плоткин, Дж. Б .; Кудла, Г. (2011). «Синоним, но не одно и то же: причины и последствия смещения кодонов». Природа Обзоры Генетика. 12 (1): 32–42. Дои:10.1038 / nrg2899. ЧВК  3074964. PMID  21102527.
  23. ^ а б Спенсер, П. С .; Баррал, Дж. М. (2012). «Избыточность генетического кода и ее влияние на кодируемые полипептиды». Журнал вычислительной и структурной биотехнологии. 1: 1–8. Дои:10.5936 / csbj.201204006. ЧВК  3962081. PMID  24688635.
  24. ^ Комерон Дж. М., Агуаде М. (сентябрь 1998 г.). «Оценка мер систематической ошибки использования синонимичных кодонов». J. Mol. Evol. 47 (3): 268–74. Bibcode:1998JMolE..47..268C. Дои:10.1007 / PL00006384. PMID  9732453.
  25. ^ Икемура Т. (сентябрь 1981 г.). «Корреляция между количеством РНК-переносчиков Escherichia coli и наличием соответствующих кодонов в его белковых генах: предложение по выбору синонимичных кодонов, оптимальных для системы трансляции E. coli». J. Mol. Биол. 151 (3): 389–409. Дои:10.1016/0022-2836(81)90003-6. PMID  6175758.
  26. ^ Фокс Дж. М., Эрилл I (июнь 2010 г.). «Относительная адаптация кодонов: общий индекс смещения кодонов для прогнозирования экспрессии генов». ДНК Res. 17 (3): 185–96. Дои:10.1093 / dnares / dsq012. ЧВК  2885275. PMID  20453079.
  27. ^ Шарп, Пол М.; Ли, Вэнь-Сюн (1987). «Индекс адаптации кодонов - мера направленной систематической ошибки использования синонимичных кодонов и его потенциальные применения». Исследования нуклеиновых кислот. 15 (3): 1281–1295. Дои:10.1093 / nar / 15.3.1281. ЧВК  340524. PMID  3547335.
  28. ^ Педен Дж (2005-04-15). «Индексы использования кодонов». Соответствующий анализ использования кодонов. SourceForge. Получено 2010-10-20.
  29. ^ Suzuki H, Brown CJ, Forney LJ, Top EM (декабрь 2008 г.). «Сравнение методов анализа соответствия для использования синонимичных кодонов у бактерий». ДНК Res. 15 (6): 357–65. Дои:10.1093 / dnares / dsn028. ЧВК  2608848. PMID  18940873.

внешняя ссылка