Правила Чаргаффа - Chargaffs rules
Правила Чаргаффа утверждать, что ДНК от любого вида любого организма должно иметь стехиометрическое соотношение 1: 1 (правило пар оснований) пиримидин и пурин баз и, более конкретно, что количество гуанин должно быть равно цитозин и количество аденин должно быть равно тимин. Этот паттерн присутствует в обеих цепях ДНК. Их открыл химик австрийского происхождения. Эрвин Чаргафф,[1][2] в конце 1940-х гг.
Определения
Правило первой четности
Первое правило гласит, что двухцепочечный ДНК молекула глобально имеет процентное равенство пар оснований:% A =% T и% G =% C. Строгая проверка правила составляет основу Пары Уотсона-Крика в модели двойной спирали ДНК.
Правило второй четности
Второе правило гласит, что как% A ≈% T, так и% G ≈% C действительны для каждой из двух цепей ДНК.[3] Это описывает только глобальную особенность базового состава в одной цепи ДНК.[4]
Исследование
Второе правило четности было открыто в 1968 году.[3] Он утверждает, что в одноцепочечной ДНК количество адениновых единиц равно примерно равно тимину (% A ≈ % T), а количество цитозиновых единиц составляет примерно равен гуанину (% C ≈ %ГРАММ).
Первое эмпирическое обобщение второго правила четности Чаргаффа, называемое принципом симметрии, было предложено Винаякумаром В. Прабху. [5] в 1993. Этот принцип гласит, что для любого данного олигонуклеотида его частота приблизительно равна частоте его комплементарного обратного олигонуклеотида. Теоретическое обобщение[6] был математически выведен Мишелем Э. Б. Ямагиши и Роберто Х. Хераи в 2011 году.[7]
В 2006 году было показано, что это правило распространяется на четыре[2] пяти типов двухцепочечных геномов; в частности, это относится к эукариотический хромосомы, то бактериальный хромосомы, двухцепочечные ДНК вирусные геномы и архей хромосомы.[8] Это не относится к органеллярные геномы (митохондрии и пластиды ) менее ~ 20-30 kbp, также он не применяется к одноцепочечным ДНК (вирусным) геномам или любому типу РНК геном. Основание для этого правила все еще исследуется, хотя размер генома может иметь значение.
Само правило имеет последствия. В большинстве бактериальных геномов (которые обычно кодируют на 80-90%) гены расположены таким образом, что примерно 50% кодирующей последовательности лежит на любой цепи. Вацлав Шибальский в 1960-х годах показали, что в бактериофаг кодирующие последовательности пурины (A и G) превышают пиримидины (C и T).[9] Это правило с тех пор было подтверждено на других организмах, и теперь его, вероятно, следует назвать "Правило Шибальского ". Хотя правило Шибальского в целом соблюдается, известны исключения.[10][11][12] Биологическая основа правления Шибальского, как и правления Чаргаффа, еще не известна.
Комбинированный эффект второго правила Чаргаффа и правила Шибальского можно увидеть в бактериальных геномах, где кодирующие последовательности распределены неравномерно. В генетический код имеет 64 кодоны из которых 3 функционируют как кодоны терминации: всего 20 аминокислоты обычно присутствует в белках. (Есть две необычные аминокислоты -селеноцистеин и пирролизин - обнаружены в ограниченном количестве белков и кодируются стоп-кодоны -TGA и TAG соответственно.) Несоответствие между количеством кодонов и аминокислот позволяет нескольким кодонам кодировать одну аминокислоту - такие кодоны обычно различаются только в положении третьего кодона.
Многофакторный статистический анализ использования кодонов в геномах с неодинаковыми количествами кодирующих последовательностей на двух цепях показал, что использование кодонов в третьей позиции зависит от цепи, на которой расположен ген. Вероятно, это результат правил Шибальского и Чаргаффа. Из-за асимметрии в использовании пиримидина и пурина в кодирующих последовательностях цепь с большим кодирующим содержанием будет иметь тенденцию иметь большее количество пуриновых оснований (правило Шибальского). Поскольку количество пуриновых оснований будет с очень хорошим приближением равняться количеству их комплементарных пиримидинов в одной и той же цепи, и, поскольку кодирующие последовательности занимают 80-90% цепи, оказывается, что (1) давление отбора на третьем основании, чтобы минимизировать количество пуриновых оснований в цепи с большим кодирующим содержанием; и (2) что это давление пропорционально несовпадению длины кодирующих последовательностей между двумя цепями.
Предполагается, что происхождение отклонения от правила Чаргаффа в органеллах является следствием механизма репликации.[13] Во время репликации нити ДНК разделяются. В одноцепочечной ДНК цитозин самопроизвольно медленно дезаминируется до аденозин (от C до A трансверсия ). Чем длиннее разделены пряди, тем больше дезаминирование. По причинам, которые еще не ясны, эти цепи имеют тенденцию существовать дольше в одной форме в митохондриях, чем в хромосомной ДНК. Этот процесс имеет тенденцию давать одну нить, обогащенную гуанин (G) и тимин (T) с его дополнением, обогащенным цитозином (C) и аденозином (A), и этот процесс, возможно, вызвал отклонения, обнаруженные в митохондриях.[нужна цитата ][сомнительный ]
Второе правило Чаргаффа, по-видимому, является следствием более сложного правила четности: в одной цепи ДНК любой олигонуклеотид присутствует в равных количествах с его обратным комплементарным нуклеотидом. Из-за вычислительных требований это не было проверено во всех геномах для всех олигонуклеотидов. Это было проверено для триплетных олигонуклеотидов для большого набора данных.[14] Альбрехт-Бюлер предположил, что это правило является следствием эволюции геномов в процессе инверсия и транспозиция.[14] Похоже, что этот процесс не повлиял на митохондриальные геномы. Второе правило четности Чаргаффа, по-видимому, распространяется с уровня нуклеотидов на популяции триплетов кодонов в случае цельной одноцепочечной ДНК генома человека.[15] Своего рода «второе правило четности Чаргаффа на уровне кодонов» предлагается следующим образом:
Первый кодон | Второй кодон | Предлагаемая связь | Подробности |
---|---|---|---|
Twx (1-я базовая позиция - Т) | yzA (3-я базовая позиция - A) | % Twx % yzA | Twx и yzA являются зеркальными кодонами, например TCG и CGA |
Cwx (1-я базовая позиция - C) | yzG (3-я базовая позиция - G) | % Cwx % yzG | Cwx и yzG являются зеркальными кодонами, например CTA и ТЕГ |
wTx (2-я базовая позиция - Т) | yAz (2-я базовая позиция - A) | % wTx % yAz | wTx и yAz являются зеркальными кодонами, например CTG и CAG |
wCx (2-я базовая позиция - C) | yGz (2-я базовая позиция - G) | % wCx % yGz | wCx и yGz являются зеркальными кодонами, например TCT и AGA |
wxT (3-я базовая позиция - Т) | Айз (1-я базовая позиция - A) | % wxT % Айз | wxT и Айз являются зеркальными кодонами, например CTT и AAG |
wxC (3-я базовая позиция - C) | Гыз (1-я базовая позиция - G) | % wxC % Гыз | wxC и Гыз являются зеркальными кодонами, например GGC и GCC |
Примеры - вычисление полного генома человека с использованием первой рамки считывания кодонов дает: 36530115 TTT и 36381293 AAA (соотношение% = 1,00409). 2087242 TCG и 2085226 CGA (соотношение% = 1.00096) и т. Д.
В 2020 году было показано, что физические свойства дцДНК (двухцепочечной ДНК) и стремление к максимальной энтропии всех физических систем являются причиной второго правила четности Чаргаффа.[16] Симметрии и паттерны, присутствующие в последовательностях дцДНК, могут возникать из-за физических особенностей молекулы дцДНК и принципа максимальной энтропии, а не из-за биологического или эволюционного давления окружающей среды.
Процент оснований в ДНК
Следующая таблица представляет собой репрезентативный образец данных Эрвина Чаргаффа за 1952 год, в котором перечислены основные составы ДНК различных организмов и поддерживаются оба правила Чаргаффа.[17] Организм, такой как φX174, со значительным отклонением от A / T и G / C, равного единице, указывает на одноцепочечную ДНК.
Организм | Таксон | % А | %ГРАММ | % C | % T | В | G / C | % GC | %В |
---|---|---|---|---|---|---|---|---|---|
Кукуруза | Зеа | 26.8 | 22.8 | 23.2 | 27.2 | 0.99 | 0.98 | 46.1 | 54.0 |
Осьминог | Осьминог | 33.2 | 17.6 | 17.6 | 31.6 | 1.05 | 1.00 | 35.2 | 64.8 |
Курица | Галл | 28.0 | 22.0 | 21.6 | 28.4 | 0.99 | 1.02 | 43.7 | 56.4 |
Крыса | Раттус | 28.6 | 21.4 | 20.5 | 28.4 | 1.01 | 1.00 | 42.9 | 57.0 |
Человек | Гомо | 29.3 | 20.7 | 20.0 | 30.0 | 0.98 | 1.04 | 40.7 | 59.3 |
Кузнечик | Прямокрылые | 29.3 | 20.5 | 20.7 | 29.3 | 1.00 | 0.99 | 41.2 | 58.6 |
Морской еж | Echinoidea | 32.8 | 17.7 | 17.3 | 32.1 | 1.02 | 1.02 | 35.0 | 64.9 |
Пшеница | Тритикум | 27.3 | 22.7 | 22.8 | 27.1 | 1.01 | 1.00 | 45.5 | 54.4 |
Дрожжи | Сахаромицеты | 31.3 | 18.7 | 17.1 | 32.9 | 0.95 | 1.09 | 35.8 | 64.4 |
Кишечная палочка | Эшерихия | 24.7 | 26.0 | 25.7 | 23.6 | 1.05 | 1.01 | 51.7 | 48.3 |
φX174 | PhiX174 | 24.0 | 23.3 | 21.5 | 31.2 | 0.77 | 1.08 | 44.8 | 55.2 |
Смотрите также
Рекомендации
- ^ Элсон Д., Чаргафф Э (1952). «О содержании дезоксирибонуклеиновой кислоты в гаметах морского ежа». Experientia. 8 (4): 143–145. Дои:10.1007 / BF02170221. PMID 14945441. S2CID 36803326.
- ^ а б Чаргафф Э., Липшиц Р., Грин С. (1952). «Состав дезоксипентозных нуклеиновых кислот четырех родов морских ежей». J Biol Chem. 195 (1): 155–160. PMID 14938364. S2CID 11358561.
- ^ а б Руднер, Р; Каркас, JD; Чаргафф, Э (1968). "Разделение Б. Субтилис ДНК в комплементарные цепи. 3. Прямой анализ ». Труды Национальной академии наук Соединенных Штатов Америки. 60 (3): 921–2. Bibcode:1968ПНАС ... 60..921Р. Дои:10.1073 / pnas.60.3.921. ЧВК 225140. PMID 4970114.
- ^ Чжан СТ, Чжан Р., Оу ХЙ (2003). «База данных кривой Z: графическое представление последовательностей генома». Биоинформатика. 19 (5): 593–599. Дои:10.1093 / биоинформатика / btg041. PMID 12651717.
- ^ Прабху В.В. (1993). «Наблюдение симметрии в длинных нуклеотидных последовательностях». Исследования нуклеиновых кислот. 21 (12): 2797–2800. Дои:10.1093 / nar / 21.12.2797. PMID 8332488.
- ^ Ямагиши MEB (2017). Математическая грамматика биологии. SpringerBriefs по математике. Springer. arXiv:1112.1528. Дои:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
- ^ Ямагиши MEB, Herai RH (2011). «Грамматика биологии» Чаргаффа: новые фрактальные правила. SpringerBriefs по математике. arXiv:1112.1528. Дои:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.CS1 maint: использует параметр авторов (связь)
- ^ Митчелл Д., Мост Р. (2006). «Проверка второго правила Чаргаффа». Biochem Biophys Res Commun. 340 (1): 90–94. Дои:10.1016 / j.bbrc.2005.11.160. PMID 16364245.
- ^ Шибальский В., Кубинский Н., Шелдрик О. (1966). «Пиримидиновые кластеры на транскрибирующей цепи ДНК и их возможная роль в инициации синтеза РНК». Колд Спринг Харб Симп Квант Биол. 31: 123–127. Дои:10.1101 / SQB.1966.031.01.019. PMID 4966069.
- ^ Кристильо А.Д. (1998). Характеристика генов переключения G0 / G1 в культивируемых Т-лимфоцитах. Кандидатская диссертация. Кингстон, Онтарио, Канада: Королевский университет.
- ^ Белл SJ, Форсдайк Д.Р. (1999). «Отклонения от второго правила четности Чаргаффа коррелируют с направлением транскрипции». J Теор Биол. 197 (1): 63–76. Дои:10.1006 / jtbi.1998.0858. PMID 10036208.
- ^ Лао П.Дж., Форсдайк Д.Р. (2000). «Термофильные бактерии строго подчиняются правилу направления транскрипции Шибальского и вежливо нагружают пурины РНК с аденином и гуанином». Геномные исследования. 10 (2): 228–236. Дои:10.1101 / гр.10.2.228. ЧВК 310832. PMID 10673280.
- ^ Николау C, Альмирантис Y (2006). «Отклонения от второго правила четности Чаргаффа в органеллярной ДНК. Понимание эволюции органеллярных геномов». Ген. 381: 34–41. Дои:10.1016 / j.gene.2006.06.010. PMID 16893615.
- ^ а б Альбрехт-Бюлер Г (2006). «Асимптотически увеличивающееся соответствие геномов правилам второй четности Чаргаффа посредством инверсий и инвертированных транспозиций». Proc Natl Acad Sci USA. 103 (47): 17828–17833. Bibcode:2006ПНАС..10317828А. Дои:10.1073 / pnas.0605553103. ЧВК 1635160. PMID 17093051.
- ^ Перес, Ж.-К. (Сентябрь 2010 г.). «Популяции кодонов в одноцепочечной цельной геномной ДНК человека фрактальны и регулируются золотым сечением 1,618». Междисциплинарные науки: вычислительная наука о жизни. 2 (3): 228–240. Дои:10.1007 / s12539-010-0022-0. PMID 20658335. S2CID 54565279.
- ^ Пьеро Фаризель, Кристиан Таччоли, Лука Пагани и Амос Маритан (апрель 2020 г.). "Симметрии последовательности ДНК от случайности: происхождение второго правила четности Чаргаффа". Брифинги по биоинформатике (bbaa04): 1–10. Дои:10.1093 / bib / bbaa041. PMID 32266404.CS1 maint: несколько имен: список авторов (связь)
- ^ Бансал М (2003). "Структура ДНК: новый взгляд на двойную спираль Уотсона-Крика" (PDF). Текущая наука. 85 (11): 1556–1563. Архивировано из оригинал (PDF) в 2014-07-26. Получено 2013-07-26.
дальнейшее чтение
- Шибальский В., Кубинский Н., Шелдрик П. (1966). «Пиримидиновые кластеры на транскрибирующих цепях ДНК и их возможная роль в инициации синтеза РНК». Симпозиумы Колд-Спринг-Харбор по количественной биологии. 31: 123–127. Дои:10.1101 / SQB.1966.031.01.019. PMID 4966069.
- Лобры-младший (1996). «Асимметричные схемы замещения в двух цепях ДНК бактерий». Мол. Биол. Evol. 13 (5): 660–665. Дои:10.1093 / oxfordjournals.molbev.a025626. PMID 8676740.
- Лафай Б., Ллойд А.Т., Маклин М.Дж., Дивайн К.М., Шарп П.М., Вулф К.Х. (1999). «Состав протеома и использование кодонов у спирохет: видоспецифические и специфичные для цепи ДНК мутационные ошибки». Нуклеиновые кислоты Res. 27 (7): 1642–1649. Дои:10.1093 / nar / 27.7.1642. ЧВК 148367. PMID 10075995.
- Маклин MJ, Вулф KH, Девайн KM (1998). «Несовпадение состава основания, ориентация репликации и ориентация генов в 12 геномах прокариот». Дж Мол Эвол. 47 (6): 691–696. Bibcode:1998JMolE..47..691M. CiteSeerX 10.1.1.28.9035. Дои:10.1007 / PL00006428. PMID 9847411. S2CID 12917481.
- Макинерни Джо (1998). «Репликационный и транскрипционный отбор по использованию кодонов у Borrelia burgdorferi». Proc Natl Acad Sci USA. 95 (18): 10698–10703. Bibcode:1998ПНАС ... 9510698М. Дои:10.1073 / пнас.95.18.10698. ЧВК 27958. PMID 9724767.
внешняя ссылка
- База данных генома CBS - содержит сотни примеров базовых перекосов и возникли проблемы.[1]
- База данных геномов Z-кривой - инструмент трехмерной визуализации и анализа геномов.[2]
- ^ Холлин П.Ф., Дэвид Уссери Д. (2004). «База данных генома CBS: динамическое хранилище биоинформатических результатов и данных последовательностей». Биоинформатика. 20 (18): 3682–3686. Дои:10.1093 / биоинформатика / bth423. PMID 15256401.
- ^ Чжан СТ, Чжан Р., Оу ХЙ (2003). «База данных кривой Z: графическое представление последовательностей генома». Биоинформатика. 19 (5): 593–599. Дои:10.1093 / биоинформатика / btg041. PMID 12651717.