Серийный анализ экспрессии генов - Serial analysis of gene expression

Краткое содержание SAGE. Внутри организмов гены записано и сращенный (в эукариоты ) для получения зрелых мРНК стенограммы (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную двухцепочечную кДНК (ds -кДНК; синий). В SAGE дц-кДНК переваривается рестрикционные ферменты (в положениях «X» и «X» + 11) для получения 11-нуклеотидных «теговых» фрагментов. Эти теги объединяются и упорядочиваются с использованием функции длительного чтения. Секвенирование по Сэнгеру (разные оттенки синего обозначают метки от разных генов). Последовательности разложенный чтобы найти частоту каждого тега. Частоту тегов можно использовать для отчета о транскрипция гена, от которого произошел тег.^[1]

Серийный анализ экспрессии генов (МУДРЕЦ) это транскриптомный метод используется молекулярными биологи сделать снимок информационная РНК популяция в интересующей выборке в виде небольших тегов, которые соответствуют фрагментам этих транскриптов. С тех пор было разработано несколько вариантов, в первую очередь более надежная версия LongSAGE,^[2] RL-SAGE^[3] и самый последний SuperSAGE.^[4] Многие из них улучшили технику за счет захвата более длинных меток, что позволяет более уверенно идентифицировать исходный ген.

Обзор

Вкратце, эксперименты SAGE проходят следующим образом:

В мРНК входного образца (например, опухоль ) изолирована, а обратная транскриптаза и биотинилированный праймеры используются для синтеза кДНК из мРНК.
КДНК связывается с гранулами стрептавидина посредством взаимодействия с биотином, прикрепленным к праймерам, и затем расщепляется с использованием эндонуклеаза рестрикции называется якорным ферментом (AE). Расположение сайта расщепления и, следовательно, длина оставшейся кДНК, связанной с шариком, будет варьироваться для каждой отдельной кДНК (мРНК).
Расщепленная кДНК ниже сайта расщепления затем отбрасывается, а оставшиеся неподвижные фрагменты кДНК выше сайтов расщепления делятся пополам и подвергаются воздействию одного из двух адапторных олигонуклеотидов (A или B), содержащих несколько компонентов в следующем порядке вверх по ходу от места прикрепления сайт: 1) липкие концы с сайтом разреза AE для присоединения к расщепленной кДНК; 2) сайт узнавания для эндонуклеазы рестрикции, известной как фермент-метка (TE), который разрезает примерно на 15 нуклеотидов ниже своего сайта узнавания (в пределах исходной последовательности кДНК / мРНК); 3) Короткая последовательность праймера, уникальная для адаптера A или B, которая позже будет использоваться для дальнейшей амплификации с помощью ПЦР.
После адаптера перевязка, кДНК расщепляются с использованием ТЕ для удаления их с гранул, оставляя только короткий «тег» из примерно 11 нуклеотидов исходной кДНК (15 нуклеотидов минус 4, соответствующие сайту узнавания AE).
Затем расщепленные метки кДНК репарируются с помощью ДНК-полимераза для получения фрагментов кДНК с тупым концом.
Эти фрагменты метки кДНК (с присоединенными адапторными праймерами и сайтами узнавания AE и TE) лигируют, соединяя две последовательности меток вместе и фланкируя адаптеры A и B на обоих концах. Эти новые конструкции, названные теги, затем амплифицируют с помощью ПЦР с использованием праймеров, специфичных для якоря A и B.
Дитаги затем расщепляются с использованием исходного AE, и разрешается связываться вместе с другими дитагами, которые будут лигированы для создания кДНК. объединитель с каждым тегом, разделенным сайтом распознавания AE.
Эти конкатемеры затем трансформируются в бактерии для амплификации посредством бактериальной репликации.
Конкатемеры кДНК затем могут быть выделены и секвенированы с использованием современных высокопроизводительных технологий. Секвенаторы ДНК, и эти последовательности могут быть проанализированы с помощью компьютерных программ, которые количественно определяют повторяемость отдельных тегов.

Анализ

Результатом SAGE является список тегов коротких последовательностей с указанием количества наблюдений. С помощью базы данных последовательностей исследователь обычно может с некоторой уверенностью определить, из какого оригинального мРНК (и, следовательно, который ген ) тег был извлечен.

Статистические методы могут применяться для маркировки и подсчета списков из разных образцов, чтобы определить, какие гены более выражены. Например, нормальный ткань образец можно сравнить с соответствующим опухоль чтобы определить, какие гены склонны быть более (или менее) активными.

История

В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro на амплификацию их библиотеки в бактериальных плазмидах.^[5] В 1982–1983 годах идея выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования была исследована Грегом Сатклиффом и его сотрудниками.^[6] и Putney et al. кто секвенировал 178 клонов из библиотеки кДНК мышц кролика.^[7] В 1991 году Адамс и его сотрудники изобрели термин выраженный тег последовательности (EST) и инициировал более систематическое секвенирование кДНК в качестве проекта (начиная с 600 кДНК мозга).^[8] Идентификация EST прошла быстро, миллионы EST теперь доступны в общедоступных базах данных (например, GenBank ).

В 1995 г. идея уменьшения длины метки со 100 до 800 п.н. до длины метки с 10 до 22 п.н. помогла снизить стоимость исследований мРНК.^[9] В этом году оригинальный протокол SAGE был опубликован Виктор Велкулеску в Онкологическом центре Университет Джона Хопкинса.^[9] Хотя SAGE изначально был задуман для использования в исследованиях рака, его успешно использовали для описания транскриптом других болезней и у самых разных организмов.

Сравнение с ДНК-микрочипами

Общая цель методики аналогична Микрочип ДНК. Однако отбор образцов SAGE основан на секвенировании выхода мРНК, а не на гибридизации выхода мРНК с зондами, поэтому уровни транскрипции измеряются более количественно, чем с помощью микроматрицы. В дополнение мРНК последовательности не нужно знать априори, поэтому гены или варианты генов, которые неизвестны, могут быть обнаружены. Микрочип Эксперименты намного дешевле проводить, поэтому в крупномасштабных исследованиях SAGE обычно не используется. Количественная оценка экспрессия генов более точен в SAGE, потому что он включает прямой подсчет количества транскриптов, тогда как интенсивность пятен в микрочипах падает недискретными градиентами и подвержена фоновому шуму.

Варианты протоколов

клонирование miRNA

МикроРНК, или сокращенно miRNAs, представляют собой небольшие (~ 22nt) сегменты РНК, которые, как было обнаружено, играют решающую роль в регуляции генов. Один из наиболее часто используемых методов клонирования и идентификации miRNA в клетке или ткани был разработан в Bartel Lab и опубликован в статье Lau и другие. (2001). С тех пор появилось несколько вариантов протоколов, но большинство из них имеют один и тот же базовый формат. Процедура очень похожа на SAGE: малая РНК выделяется, затем к каждой добавляются линкеры, и РНК преобразуется в кДНК посредством ОТ-ПЦР. После этого линкеры, содержащие внутренние сайты рестрикции, перевариваются соответствующим рестрикционным ферментом, и липкие концы лигируются вместе в конкатамеры. После конкатенации фрагменты лигируют в плазмиды и используют для трансформации бактерий для создания множества копий плазмиды, содержащей вставки. Затем их можно секвенировать для идентификации присутствующей miRNA, а также для анализа уровней экспрессии данной miRNA путем подсчета количества ее присутствий, аналогично SAGE.

LongSAGE и RL-SAGE

LongSAGE был более надежной версией оригинального SAGE, разработанного в 2002 году, который имел более высокую пропускную способность, используя 20 мкг мРНК для создания библиотеки кДНК из тысяч тегов.^[10] Robust LongSage (RL-SAGE) Дальнейшее усовершенствование протокола LongSAGE с возможностью создания библиотеки с размером вставки 50 нг. мРНК, намного меньше, чем предыдущая вставка LongSAGE, размер 2 мкг мРНК^[10] и используя меньшее количество цепных реакций полимеразы ditag (ПЦР ) для получения полного кДНК библиотека.^[11]

SuperSAGE

SuperSAGE является производным от SAGE, который использует тип III-эндонуклеаза EcoP15I из фаг P1, чтобы вырезать теги последовательности длиной 26 п.н. из каждого транскрипта кДНК, увеличивая размер тега как минимум на 6 п.н. по сравнению с предшествующими методами SAGE и LongSAGE.^[12] Более длинный размер тега позволяет более точно отнести тег к соответствующему транскрипту, поскольку каждая дополнительная база значительно увеличивает точность аннотации.

Как и в исходном протоколе SAGE, так называемые дитаги формируются с использованием тупой теги. Однако SuperSAGE позволяет избежать систематической ошибки, наблюдаемой во время менее случайного лигирования длинных последовательностей длиной 20 п.н.^[13] Путем прямого секвенирования с помощью высокопроизводительных методов секвенирования (секвенирование следующего поколения, т.е. пиросеквенирование ), сотни тысяч или миллионы тегов могут быть проанализированы одновременно, обеспечивая очень точные и количественные профили экспрессии генов. Следовательно, профилирование экспрессии генов на основе тегов, также называемое «цифровым профилированием экспрессии генов» (DGE), сегодня может обеспечить наиболее точные профили транскрипции, которые преодолевают ограничения микрочипы.^[14]^[15]

Секвенирование 3'-концов мРНК, массовый анализ концов кДНК

В середине 2010-х годов было разработано несколько методов в сочетании с секвенированием следующего поколения, в которых используется принцип «тегов» для «цифрового профилирования экспрессии генов», но без использования фермента-тега. Подход «MACE» (= массивный анализ концов кДНК) генерирует теги где-то в последних 1500 п.о. транскрипта. Этот метод больше не зависит от рестрикционных ферментов и, таким образом, позволяет избежать систематической ошибки, связанной с отсутствием или расположением сайта рестрикции в кДНК. Вместо этого кДНК фрагментируется случайным образом, а 3'-концы секвенируются от 5'-конца молекулы кДНК, которая несет поли-A-хвост. Длина последовательности тегов может быть выбрана произвольно. Благодаря этому теги могут быть собраны в контиги, и аннотация тегов может быть значительно улучшена. Таким образом, MACE также используется для анализа немодельных организмов. Кроме того, более длинные контиги могут быть проверены на полиморфизм. Поскольку UTR демонстрируют большое количество полиморфизмов между индивидуумами, подход MACE может применяться для определения аллелей, профилирования аллель-специфической экспрессии генов и поиска молекулярных маркеров для разведения. Кроме того, подход позволяет определять альтернативное полиаденилирование транскриптов. Поскольку MACE требует только 3 ’концов транскриптов, даже частично деградированная РНК может быть проанализирована с меньшим искажением, зависящим от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР. ^[16]

Смотрите также

внешняя ссылка

[1] Шафи, Томас; Лоу, Рохан (2017). «Структура эукариотических и прокариотических генов». WikiJournal of Медицина. 4 (1). Дои:10.15347 / wjm / 2017.002. ISSN 2002-4436.

[Saha-2] Saha S, et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol. 20 (5): 508–12. Дои:10.1038 / nbt0502-508. PMID 11981567.

[Gowda-3] Gowda M; Джантасуриярат С; Декан Р.А.; Ван ГЛ. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Физиология растений. 134 (3): 890–7. Дои:10.1104 / стр.103.034496. ЧВК 389912. PMID 15020752.

[Matsumura-4] Matsumura H; Ито А; Сайто Н; Winter P; Kahl G; Reuter M; Krüger DH; Тераучи Р. (2005). «СУПЕРСЕЙД». Клеточный микробиол. 7 (1): 11–8. Дои:10.1111 / j.1462-5822.2004.00478.x. PMID 15617519.

[5] Сим ГК; Кафатос ФК; Джонс CW; Koehler MD; Efstratiadis A; Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для изучения эволюции и развития экспрессии мультигенных семейств хориона». Клетка. 18 (4): 1303–16. Дои:10.1016/0092-8674(79)90241-1. PMID 519770.

[6] Сатклифф Дж. Г.; Milner RJ; Bloom FE; Лернер Р.А. (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга». Proc Natl Acad Sci U S A. 79 (16): 4942–6. Bibcode:1982PNAS ... 79.4942S. Дои:10.1073 / пнас.79.16.4942. ЧВК 346801. PMID 6956902.

[7] Putney SD; Herlihy WC; Шиммель П. (1983). «Новые клоны тропонина Т и кДНК для 13 различных мышечных белков, обнаруженные путем секвенирования дробовика». Природа. 302 (5910): 718–21. Bibcode:1983Натура.302..718П. Дои:10.1038 / 302718a0. PMID 6687628.

[adams-8] Adams MD, Kelley JM, Gocayne JD, et al. (Июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессированной последовательности и проект генома человека». Наука. 252 (5013): 1651–6. Bibcode:1991Научный ... 252.1651A. Дои:10.1126 / science.2047873. PMID 2047873.

[SAGE-9] а ^б Велкулеску В.Е.; Zhang L; Фогельштейн B; Kinzler KW. (1995). «Серийный анализ экспрессии генов». Наука. 270 (5235): 484–7. Bibcode:1995Научный ... 270..484В. Дои:10.1126 / science.270.5235.484. PMID 7570003.

[Saha,_S._2002-10] а ^б Saha, S., et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol 20 (5): 508-512.

[11] Gowda, M., et al. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Физиология растений 134 (3): 890-897.

[Matsumura2003-12] Matsumura, H .; Reich, S .; Ито, А .; Saitoh, H .; Kamoun, S .; Winter, P .; Kahl, G .; Reuter, M .; Krüger, D .; Тераучи, Р. (2003). «Анализ экспрессии генов при взаимодействии растений-хозяев-патогенов с помощью SuperSAGE». Труды Национальной академии наук. 100 (26): 15718–15723. Bibcode:2003ПНАС..10015718М. Дои:10.1073 / pnas.2536670100. ЧВК 307634. PMID 14676315.

[13] Говда, Малали; Джантасуриярат, Чатчаван; Дин, Ральф А .; Ван, Го-Лян (2004-03-01). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптома». Физиология растений. 134 (3): 890–897. Дои:10.1104 / стр.103.034496. ISSN 1532-2548. ЧВК 389912. PMID 15020752.

[14] Шендуре, Дж. (2008). «Начало конца для микрочипов?». Природные методы. 5 (7): 585–7. Дои:10.1038 / nmeth0708-585. PMID 18587314.

[15] Matsumura, H .; Bin Nasir, K. H .; Yoshida, K .; Ито, А .; Kahl, G.N .; Крюгер, Д. Х .; Тераучи, Р. (2006). «Массив SuperSAGE: прямое использование тегов транскрипции из 26 пар оснований в массивах олигонуклеотидов». Природные методы. 3 (6): 469–74. Дои:10.1038 / nmeth882. PMID 16721381.

[16] Завада, Адам (январь 2014 г.). «Массивный анализ концов кДНК (MACE) и профили экспрессии miRNA выявляют проатерогенные пути при хроническом заболевании почек». Эпигенетика. 9 (1): 161–172. Дои:10.4161 / epi.26931. ЧВК 3928179. PMID 24184689.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]