Кодирующая область - Coding region

В кодирующая область из ген, также известный как CDS (из кодирующая последовательность), является частью гена ДНК или РНК это коды для белок.[1] Изучение длины, состава, регуляции, сплайсинга, структур и функций кодирующих областей по сравнению с некодирующими областями для разных видов и периодов времени может предоставить значительный объем важной информации об организации генов и эволюции прокариоты и эукариоты.[2] Это может дополнительно помочь в отображении человеческий геном и разработка генной терапии.[3]

Определение

Хотя этот термин также иногда используется как синоним экзон, это не одно и то же: экзон состоит из кодирующей области, а также 3 'и 5' непереведенные регионы РНК, и, следовательно, экзон будет частично состоять из кодирующих областей. 3 'и 5' непереведенные регионы РНК, которые не кодируют белок, называются некодирование регионы и не обсуждаются на этой странице.[4]

Часто возникает путаница между областями кодирования и экзомы и между этими терминами существует четкое различие. В то время экзом относится ко всем экзонам в геноме, кодирующая область относится к единственному участку ДНК или РНК, который специфически кодирует определенный вид белка.

История

В 1978 г. Уолтер Гилберт опубликовал книгу «Почему гены в кусочках», в которой впервые было начато исследование идеи о том, что ген представляет собой мозаику - что каждый полный нуклеиновая кислота цепь не кодируется непрерывно, а прерывается «молчащими» некодирующими областями. Это было первым признаком того, что должно быть различие между частями генома, которые кодируют белок, теперь называемыми кодирующими областями, и теми, которые этого не делают.[5]

Сочинение

Типы точечных мутаций: переходы (синий) увеличены по сравнению с трансверсиями (красный) в GC-богатых кодирующих областях.[6]

Данные свидетельствуют о том, что существует общая взаимозависимость между шаблонами базового состава и доступностью кодирующей области.[7] Считается, что кодирующая область содержит более высокий GC-контент чем некодирующие области. Дальнейшие исследования показали, что чем длиннее кодирующая цепь, тем выше содержание GC. Короткие кодирующие цепи все еще сравнительно бедны GC, как и низкое содержание GC трансляционной композиции базовой композиции. стоп-кодоны как TAG, TAA и TGA.[8]

Области, богатые GC, также имеют соотношение точечная мутация вид немного изменен: есть еще переходы, которые представляют собой переход от пурина к пурину или пиримидина на пиримидин по сравнению с трансверсии, которые представляют собой превращения пурина в пиримидин или пиримидина на пурин. Переходы с меньшей вероятностью изменят кодируемую аминокислоту и останутся тихая мутация (особенно если они встречаются в третьем нуклеотид кодона), который обычно полезен для организма во время трансляции и образования белка.[9]

Это указывает на то, что основные кодирующие области (богатые генами) имеют более высокое содержание GC, более стабильны и устойчивы к мутация по сравнению с дополнительными и второстепенными регионами (бедные генами).[10] Однако до сих пор неясно, произошло ли это в результате нейтральной и случайной мутации или в результате паттерна отбор.[11] Также ведутся споры о том, являются ли используемые методы, такие как окна генов, для установления взаимосвязи между GC-содержанием и областью кодирования, точными и беспристрастными.[12]

Структура и функции

Транскрипция: РНК-полимераза (RNAP) использует цепочку ДНК-матрицы и начинает кодирование с промоторной последовательности (зеленый) и заканчивается на терминаторной последовательности (красный), чтобы охватить всю кодирующую область в мРНК продукта (бирюзовый). [Я сомневаюсь, что конец 5 'и 3' показан на этом рисунке неправильно]

В ДНК, кодирующая область фланкируется промоторная последовательность на 5 'конце шаблон прядь и завершающую последовательность на 3'-конце. В течение транскрипция, то РНК-полимераза (РНКП) связывается с промоторной последовательностью и перемещается по матричной цепи к кодирующей области. Затем RNAP добавляет РНК нуклеотиды дополняют кодирующую область, чтобы сформировать мРНК, заменяя урацил на месте тимин.[13] Это продолжается до тех пор, пока RNAP не достигнет последовательности завершения.[13]

После транскрипции и созревания зрелая мРНК сформированный включает в себя несколько частей, важных для его окончательного перевода на белок. Кодирующая область в мРНК фланкируется 5 'непереведенный регион (5'-UTR) и 3 'непереведенный регион (3'-UTR),[1] то Крышка 5 футов, и Поли-А хвост. В течение перевод, то рибосома облегчает прикрепление тРНК к кодирующей области, по 3 нуклеотида за раз (кодоны ).[14] ТРНК переносят связанные аминокислоты к растущему полипептид цепи, в конечном итоге формируя белок, определенный в начальной кодирующей области ДНК.

Кодирующая область (бирюзовый) фланкируется нетранслируемыми областями, 5 'крышкой и поли (A) хвостом, которые вместе образуют зрелая мРНК.[15]

Регулирование

Кодирующая область может быть изменена, чтобы регулировать экспрессию гена.

Алкилирование является одной из форм регуляции кодирующей области.[16] Ген, который должен был быть транскрибирован, может быть заглушен путем нацеливания на определенную последовательность. Базы в этой последовательности будут заблокированы с помощью алкильные группы, которые создают заглушить эффект.[17]

В то время регуляция экспрессии генов управляет обилием РНК или белка, производимого в клетке, регулирование этих механизмов может контролироваться регуляторная последовательность найдено до открытая рамка чтения начинается в цепи ДНК. В регуляторная последовательность затем определит место и время, когда произойдет экспрессия для области, кодирующей белок.[18]

Сплайсинг РНК в конечном итоге определяет, какая часть последовательности будет транслироваться и выражаться, и этот процесс включает вырезание интронов и объединение экзонов. Где РНК сплайсосома сокращений, однако, руководствуется признанием сайты сращивания, в частности, 5'-сайт сплайсинга, который является одной из подложек для первого этапа сплайсинга.[19] Кодирующие области находятся внутри экзонов, которые ковалентно соединяются вместе с образованием зрелая информационная РНК.

Мутации

Мутации в кодирующей области могут иметь самые разнообразные эффекты на фенотип организма. В то время как некоторые мутации в этой области ДНК / РНК могут привести к благоприятным изменениям, другие могут быть вредными, а иногда даже смертельными для выживания организма. Напротив, изменения в кодирующей области не всегда могут приводить к обнаруживаемым изменениям фенотипа.

Типы мутации

Примеры различных форм точечные мутации которые могут существовать в кодирующих областях. Такие изменения могут иметь или не иметь фенотипические изменения, в зависимости от того, кодируют ли они различные аминокислоты во время трансляции.[20]

Существуют различные формы мутаций, которые могут возникать в кодирующих областях. Одна форма тихие мутации, в котором изменение нуклеотидов не приводит к изменению аминокислоты после транскрипции и трансляции.[21] Также существуют бессмысленные мутации, где изменения оснований в кодирующей области кодируют преждевременный стоп-кодон, производя более короткий конечный белок. Точечные мутации, или изменения одной пары оснований в кодирующей области, которые кодируют разные аминокислоты во время трансляции, называются миссенс-мутации. Другие типы мутаций включают: мутации сдвига рамки считывания такие как вставки или удаления.[21]

Формирование

Некоторые формы мутаций наследственный (мутации зародышевой линии ) или передается от родителей к потомкам.[22] Такие мутировавшие кодирующие области присутствуют во всех клетках организма. Приобретаются другие формы мутаций (соматические мутации ) в течение жизни организма и может не быть постоянным от клетки к клетке.[22] Эти изменения могут быть вызваны мутагены, канцерогены, или другие агенты окружающей среды (например, УФ ). Приобретенные мутации также могут быть результатом ошибок копирования во время Репликация ДНК и не передаются потомству. Изменения в области кодирования также могут быть de novo (новый); такие изменения происходят вскоре после оплодотворение, в результате чего мутация присутствует в ДНК потомства, но отсутствует как в сперматозоидах, так и в яйцеклетках.[22]

Профилактика

Существует несколько механизмов транскрипции и трансляции для предотвращения летальности из-за вредных мутаций в кодирующей области. Такие меры включают корректура некоторыми ДНК-полимеразы во время репликации, ремонт несоответствия после репликации,[23] и 'Гипотеза колебания 'который описывает вырождение третьего основания в кодоне мРНК.[24]

Области ограниченного кодирования (CCR)

Хотя хорошо известно, что геном одного человека может иметь значительные различия по сравнению с геномом другого, недавние исследования показали, что некоторые кодирующие области сильно ограничены или устойчивы к мутации между особями одного и того же вида. Это похоже на концепцию межвидовых ограничений в консервативные последовательности. Исследователи назвали эти сильно ограниченные последовательности кодирующими областями (CCR), а также обнаружили, что такие области могут участвовать в отбор с высокой степенью очистки. В среднем на каждые 7 кодирующих оснований приходится примерно 1 мутация, изменяющая белок, но некоторые CCR могут иметь последовательность более 100 оснований без наблюдаемых мутаций, изменяющих белок, а некоторые даже без синонимичных мутаций.[25] Эти образцы ограничений между геномами могут дать ключ к разгадке источников редких болезни развития или потенциально даже эмбриональная летальность. Клинически подтвержденные варианты и de novo мутации в CCR ранее были связаны с такими расстройствами, как детская эпилептическая энцефалопатия, задержка развития и тяжелые сердечные заболевания.[25]

Обнаружение последовательности кодирования

При выявлении открытые рамки для чтения Внутри последовательности ДНК нетрудно определить кодирующие последовательности, потому что клетка транслирует в белки только часть всех открытых рамок считывания.[26] В настоящее время прогнозирование CDS использует выборку и секвенирование мРНК из клеток, хотя все еще существует проблема определения того, какие части данной мРНК фактически транслируются в белок. Прогноз CDS - это подмножество предсказание генов последнее также включает предсказание последовательностей ДНК, которые кодируют не только белок, но и другие функциональные элементы, такие как гены РНК и регуляторные последовательности.

В обоих прокариоты и эукариоты, перекрытие генов относительно часто встречается как в ДНК, так и в РНК-вирусах в качестве эволюционного преимущества для уменьшения размера генома при сохранении способности продуцировать различные белки из доступных кодирующих областей.[27][28] И для ДНК, и для РНК попарные выравнивания может обнаруживать перекрывающиеся области кодирования, в том числе короткие открытые рамки для чтения в вирусах, но потребуется известная кодирующая цепь для сравнения с потенциальной перекрывающейся кодирующей цепью.[29] Альтернативный метод, использующий одиночные последовательности генома, не потребовал бы множественных последовательностей генома для выполнения сравнений, но потребовал бы по крайней мере 50 перекрывающихся нуклеотидов, чтобы быть чувствительным.[30]

Смотрите также

Рекомендации

  1. ^ а б Твайман, Ричард (1 августа 2003 г.). «Структура гена». Wellcome Trust. Архивировано из оригинал 28 марта 2007 г.. Получено 6 апреля 2003.
  2. ^ Höglund M, Säll T, Röhme D (февраль 1990 г.). «О происхождении кодирующих последовательностей из случайных открытых рамок считывания». Журнал молекулярной эволюции. 30 (2): 104–108. Bibcode:1990JMolE..30..104H. Дои:10.1007 / bf02099936. ISSN  0022-2844. S2CID  5978109.
  3. ^ Сахаркар МК, Чоу В.Т., Кангуане П. (2004). «Распределение экзонов и интронов в геноме человека». В биологии Silico. 4 (4): 387–93. PMID  15217358.
  4. ^ Парнелл, Лоуренс Д. (01.01.2012). «Достижения в технологиях и дизайне исследований». In Bouchard, C .; Ордовас, Дж. М. (ред.). Последние достижения в области нутригенетики и нутригеномики. Прогресс в молекулярной биологии и переводческой науке. Последние достижения в области нутригенетики и нутригеномики. 108. Академическая пресса. С. 17–50. Дои:10.1016 / B978-0-12-398397-8.00002-2. ISBN  9780123983978. PMID  22656372. Получено 2019-11-07.
  5. ^ Гилберт В. (февраль 1978 г.). «Почему гены по частям?». Природа. 271 (5645): 501. Bibcode:1978Натура.271..501Г. Дои:10.1038 / 271501a0. PMID  622185. S2CID  4216649.
  6. ^ (нет данных). Получено с https://www.differencebetween.com/wp-content/uploads/2017/03/Difference-Between-Transition-and-Transversion-3.png.
  7. ^ Lercher MJ, Urrutia AO, Pavlícek A, Hurst LD (октябрь 2003 г.). «Объединение мозаичных структур в геноме человека». Молекулярная генетика человека. 12 (19): 2411–5. Дои:10.1093 / hmg / ddg251. PMID  12915446.
  8. ^ Оливер Дж. Л., Марин А. (сентябрь 1996 г.). «Взаимосвязь между содержанием GC и длиной кодирующей последовательности». Журнал молекулярной эволюции. 43 (3): 216–23. Bibcode:1996JMolE..43..216O. Дои:10.1007 / pl00006080. PMID  8703087.
  9. ^ «РОЗАЛИНД | Глоссарий | Кодирующая область генов». rosalind.info. Получено 2019-10-31.
  10. ^ Виноградов А.Е. (апрель 2003 г.). «Спираль ДНК: важность наличия GC-богатых». Исследования нуклеиновых кислот. 31 (7): 1838–44. Дои:10.1093 / нар / gkg296. ЧВК  152811. PMID  12654999.
  11. ^ Болин Дж., Элдхольм В., Петтерссон Дж. Х., Брюнилдсруд О., Снайпен Л. (февраль 2017 г.). «Нуклеотидный состав микробных геномов указывает на дифференциальные модели отбора на основных и дополнительных геномах». BMC Genomics. 18 (1): 151. Дои:10.1186 / s12864-017-3543-7. ЧВК  5303225. PMID  28187704.
  12. ^ Семон М., Муширу Д., Дюре Л. (февраль 2005 г.). «Связь между экспрессией генов и GC-содержанием у млекопитающих: статистическая значимость и биологическая значимость». Молекулярная генетика человека. 14 (3): 421–7. Дои:10.1093 / hmg / ddi038. PMID  15590696.
  13. ^ а б Обзор транскрипции. (нет данных). Получено с https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.
  14. ^ Клэнси, Сюзанна (2008). «Перевод: ДНК в мРНК в белок». Scitable: By Nature Education.
  15. ^ Плоциам (2008-08-08), Английский: Структура зрелой эукариотической мРНК. Полностью процессированная мРНК включает 5 'кэп, 5' UTR, кодирующую область, 3 'UTR и поли (A) хвост., получено 2019-11-19
  16. ^ Шинохара К., Сасаки С., Миношима М., Бандо Т., Сугияма Х. (13 февраля 2006 г.). «Алкилирование матричной цепи кодирующей области вызывает эффективное подавление гена». Исследования нуклеиновых кислот. 34 (4): 1189–95. Дои:10.1093 / нар / gkl005. ЧВК  1383623. PMID  16500890.
  17. ^ «Термин онтологии гена алкилирования ДНК (GO: 0006305)». www.informatics.jax.org. Получено 2019-10-30.
  18. ^ Шафи Т., Лоу Р. (2017). «Структура эукариотических и прокариотических генов». WikiJournal of Медицина. 4 (1). Дои:10.15347 / wjm / 2017.002.
  19. ^ Конарская М.М. (1998). «Распознавание 5 'сайта сплайсинга сплайсосомой». Acta Biochimica Polonica. 45 (4): 869–81. Дои:10.18388 / abp.1998_4346. PMID  10397335.
  20. ^ Jonsta247 (2013-05-10), Английский: Пример тихой мутации, получено 2019-11-19
  21. ^ а б Ян, Дж. (23 марта 2016 г.). Что такое генетическая мутация? Получено с https://www.singerinstruments.com/resource/what-are-genetic-mutation/.
  22. ^ а б c Что такое генная мутация и как происходят мутации? - Домашний справочник по генетике - NIH. (нет данных). Получено с https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.
  23. ^ Вычитка и исправление ДНК. (нет данных). Получено с https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-discovery-and-structure-of-dna/a/dna-proofreading-and-repair.
  24. ^ Перето Дж. (2011) Гипотеза колебания (генетика). В: Gargaud M. et al. (ред.) Энциклопедия астробиологии. Шпрингер, Берлин, Гейдельберг
  25. ^ а б Хаврилла, Дж. М., Педерсен, Б. С., Лайер, Р. М., и Куинлан, А. Р. (2018). Карта ограниченных кодирующих областей в геноме человека. Природа Генетика, 88–95. DOI: 10.1101 / 220814
  26. ^ Фуруно М., Касукава Т., Сайто Р., Адачи Дж., Сузуки Н., Балдарелли Р. и др. (Июнь 2003 г.). «Аннотации CDS в полноразмерной последовательности кДНК». Геномные исследования. Лабораторный пресс Колд-Спринг-Харбор. 13 (6B): 1478–87. Дои:10.1101 / гр.1060303. ЧВК  403693. PMID  12819146.
  27. ^ Рогозин И.Б., Спиридонов А.Н., Сорокин А.В., Вольф Ю.И., Йордан И.К., Татусов Р.Л., Кунин Е.В. (май 2002 г.). «Очищающий и направленный отбор перекрывающихся прокариотических генов». Тенденции в генетике. 18 (5): 228–32. Дои:10.1016 / S0168-9525 (02) 02649-5. PMID  12047938.
  28. ^ Кирико Н., Вианелли А., Белшоу Р. (декабрь 2010 г.). «Почему у вирусов перекрываются гены». Ход работы. Биологические науки. 277 (1701): 3809–17. Дои:10.1098 / rspb.2010.1052. ЧВК  2992710. PMID  20610432.
  29. ^ Ферт А.Е., Браун С.М. (февраль 2005 г.). «Обнаружение перекрывающихся кодирующих последовательностей с попарным выравниванием». Биоинформатика. 21 (3): 282–92. Дои:10.1093 / биоинформатика / bti007. PMID  15347574.
  30. ^ Schlub TE, Buchmann JP, Holmes EC (октябрь 2018 г.). Малик Х (ред.). «Простой метод обнаружения перекрывающихся генов-кандидатов в вирусах с использованием одиночных геномных последовательностей». Молекулярная биология и эволюция. 35 (10): 2572–2581. Дои:10.1093 / molbev / msy155. ЧВК  6188560. PMID  30099499.