Байесовский инструмент для анализа метилирования - Bayesian tool for methylation analysis

Байесовский инструмент для анализа метилирования, также известный как БЭТМЕН, это статистический инструмент для анализа иммунопреципитация метилированной ДНК (MeDIP) профили. Его можно применить к большим наборам данных, созданным с использованием либо олигонуклеотид массивы (MeDIP-чип) или секвенирование следующего поколения (MeDIP-seq), обеспечивающий количественную оценку абсолютного метилирование состояние в интересующем регионе.[1]

Рабочий процесс Бэтмена

Теория

MeDIP (иммунопреципитация метилированной ДНК) - экспериментальный метод, используемый для оценки ДНК уровни метилирования с помощью антитело для выделения метилированных последовательностей ДНК. Выделенные фрагменты ДНК либо гибридизуют с микрочипом (MeDIP-chip), либо секвенируют с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это говорит вам, какие области геном метилированы, он не дает абсолютных уровней метилирования. Представьте себе две разные области генома, А и B. Область, край А имеет шесть CpG (метилирование ДНК у млекопитающих соматические клетки обычно возникает при CpG динуклеотиды[2]), три из которых метилированы. Область, край B имеет три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированная ДНК, он будет связывать обе эти области в равной степени, и поэтому последующие шаги будут показывать одинаковые сигналы для этих двух областей. Это не дает полной картины метилирования в этих двух регионах (в регионе А только половина CpG метилирована, тогда как в области B все CpG метилированы). Следовательно, чтобы получить полную картину метилирования для данной области, вы должны нормализовать сигнал, который вы получаете от эксперимента MeDIP, на количество CpG в регионе, и это то, что Бэтмен алгоритм делает. Анализ сигнала MeDIP в приведенном выше примере дал бы Бэтмену оценку 0,5 для региона. А (т.е. регион метилирован на 50%) и 1 для региона B (т.е. область на 100% метилирована). Таким образом, Бэтмен преобразует сигналы экспериментов MeDIP в абсолютные уровни метилирования.

Развитие Бэтмена

Основной принцип алгоритма Бэтмена состоит в моделировании эффектов различной плотности динуклеотидов CpG и их влияния на обогащение фрагментов ДНК MeDIP. Основные предположения Бэтмена:

  1. Почти все метилирование ДНК в млекопитающие бывает у динуклеотидов CpG.
  2. Большинство регионов с низким содержанием CpG метилированы конститутивно, тогда как большинство участков с высоким содержанием CpG (островков CpG) конститутивно неметилированы.[3]
  3. В эксперименте MeDIP нет фрагментных смещений (примерный диапазон размеров фрагментов ДНК составляет 400–700 п.н.).
  4. Ошибки на микрочип нормально распределяются с точностью.
  5. Только метилированные CpG вносят вклад в наблюдаемый сигнал.
  6. Состояние метилирования CpG обычно сильно коррелирует по сотням оснований,[4] поэтому CpG, сгруппированные вместе в окнах размером 50 или 100 п.н., будут иметь одинаковое состояние метилирования.

Основные параметры в Бэтмене:

  1. Ccp: коэффициент связи между зондом p и динуклеотидом CpG c, определяется как доля ДНК молекулы гибридизация с зондом п которые содержат CpGc.
  2. Cмалыш : общий параметр влияния CpG, определяется как сумма факторов связи для любого данного зонда, которая обеспечивает меру локальной плотности CpG
  3. мc : статус метилирования в позиции c, что представляет собой долю хромосомы в образце, в котором он метилирован. мc рассматривается как непрерывная переменная поскольку большинство образцов, используемых в исследованиях MeDIP, содержат несколько типов клеток.

Исходя из этих предположений, сигнал от канала MeDIP в MeDIP-чипе или эксперименте MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что, в свою очередь, зависит от количества связывание антител и, следовательно, к количеству метилированных CpG на этих фрагментах. В модели Бэтмена полный набор данных из эксперимента MeDIP / чип, A, может быть представлен статистической моделью в форме следующего распределение вероятностей:

куда (Икс|μσ2) это Гауссовский функция плотности вероятности. Стандарт Байесовский методы могут использоваться для вывода ж(м|А), то есть распределение вероятных состояний метилирования с учетом одного или нескольких наборов выходов MeDIP-chip / MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенная выборка (http://www.inference.phy.cam.ac.uk/bayesys/ ) для генерации 100 независимых выборок из ж(м|А) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 п.н., подбирая бета-распределения для этих образцов. Режимы наиболее вероятных бета-версии были использованы как окончательные вызовы метилирования.

Ограничения

При рассмотрении вопроса об использовании Бэтмена может быть полезно принять во внимание следующие моменты:

  1. Бэтмен - это не часть программного обеспечения; это алгоритм, выполняемый с использованием командная строка. Как таковой, он не особенно удобен для пользователя и представляет собой довольно сложный в вычислительном отношении процесс.
  2. Поскольку это некоммерческий подход, при использовании Бэтмена очень мало поддержки, кроме того, что указано в руководстве.
  3. Это довольно трудоемко (анализ одной хромосомы может занять несколько дней). (Примечание: в одной правительственной лаборатории запуск Бэтмена на наборе из 100 массивов Agilent для метилирования человеческой ДНК (около 250 000 зондов на массив) занял менее часа в программном обеспечении Agilent Genomic Workbench. Наш компьютер имел процессор 2 ГГц, 24 ГБ ОЗУ , 64-битная Windows 7.)
  4. Копировать вариант номера (CNV) необходимо учитывать. Например, оценка для региона с Значение CNV 1,6 дюйма рак (потеря 0,4 по сравнению с нормальной) должна быть умножена на 1,25 (= 2 / 1,6), чтобы компенсировать потерю.
  5. Одно из основных предположений Бэтмена состоит в том, что все метилирование ДНК происходит в динуклеотидах CpG. Хотя это обычно так позвоночное животное соматических клеток, бывают ситуации, когда широко распространено метилирование не-CpG, например, в клетках растений и эмбриональные стволовые клетки.[5][6]

Рекомендации

  1. ^ Вниз, Т.А. и другие. Байесовская стратегия деконволюции для анализа метиломов ДНК на основе иммунопреципитации. Природа Биотехнологии 26, 779–85 (2008).
  2. ^ Листер, Р. и другие. ДНК человека метиломы в базовом разрешении показать широко распространенное эпигеномный различия. Природа 462, 315–22 (2009).
  3. ^ Берд А. Паттерны метилирования ДНК и эпигенетическая память. Гены и развитие 16, 6–21 (2002).
  4. ^ Экхардт, Ф. и другие. Профилирование ДНК метилирования хромосом человека 6, 20 и 22. Природа Генетика 38, 1378–85 (2006).
  5. ^ Додж Дж. Э., Рамсахой Б. Х., Ву З. Г., Окано М. и Ли Е. De novo метилирование провируса MMLV в эмбриональных стволовых клетках: CpG по сравнению с метилированием не-CpG. Ген 289, 41–8 (2002)
  6. ^ Ванюшин, Б.Ф. Метилирование ДНК у растений. Актуальные темы микробиологии и иммунологии 301, 67–122 (2006)