Вывод биологической сети - Biological network inference

Вывод биологической сети это процесс создания выводы и предсказания о биологические сети.[1]

Биологические сети

Сеть - это набор узлов и набор направленных или неориентированных ребер между узлами. Существует множество типов биологических сетей, включая транскрипционные, сигнальные и метаболические. Немногие такие сети известны в чем-либо, приближающемся к их полной структуре, даже в самых простых. бактерии. Еще меньше известно о параметрах, управляющих поведением таких сетей во времени, о том, как взаимодействуют сети на разных уровнях соты и как предсказать полное описание состояния сети. эукариотический клетка или бактериальный организм в определенный момент в будущем. Системная биология в этом смысле все еще находится в зачаточном состоянии.

Есть большой интерес к сетевая медицина для моделирование биологических систем. Эта статья посвящена необходимому предварительному условию для динамического моделирования сети: логическому выводу топология, то есть предсказание «монтажной схемы» сети. Более конкретно, мы сосредоточены здесь на выводе структуры биологической сети с использованием растущих наборов данных экспрессии с высокой пропускной способностью для гены, белки, и метаболиты.[2] Вкратце, методы, использующие данные с высокой пропускной способностью для вывода регулирующих сетей, основываются на поиске паттернов частичной корреляции или условных вероятностей, указывающих на причинное влияние.[3][4] Такие образцы частичных корреляций, обнаруженные в данных с высокой пропускной способностью, возможно, в сочетании с другими дополнительными данными о генах или белках в предлагаемых сетях или в сочетании с другой информацией об организме, формируют основу, на которой такие алгоритмы работай. Такие алгоритмы могут быть полезны при выводе топологии любой сети, в которой изменение состояния одного узел может повлиять на состояние других узлов.

Сети регуляции транскрипции

Гены - это узлы, а ребра направлены. Ген служит источником прямого регуляторного края целевого гена, производя РНК или белковая молекула, которая функционирует как активатор транскрипции или ингибитор гена-мишени. Если ген является активатором, то он является источником положительной регуляторной связи; если ингибитор, то он является источником отрицательной регуляторной связи. Вычислительные алгоритмы принимают в качестве первичных входных данных измерения мРНК уровни экспрессии рассматриваемых генов для включения в сеть, возвращая оценку сети топология. Такие алгоритмы обычно основаны на предположениях о линейности, независимости или нормальности, которые необходимо проверять в каждом конкретном случае.[5] Кластеризация или какая-либо форма статистической классификации обычно используется для выполнения начальной организации значений экспрессии мРНК с высокой пропускной способностью, полученных из экспериментов с микрочипами, в частности, для выбора наборов генов в качестве кандидатов в сетевые узлы.[6] Тогда возникает вопрос: как результаты кластеризации или классификации могут быть связаны с лежащей в основе биологией? Такие результаты могут быть полезны для классификации паттернов - например, для классификации подтипов рак, или для прогнозирования дифференциальной реакции на препарат, средство, медикамент (фармакогеномика). Но чтобы понять отношения между генами, то есть более точно определить влияние каждого гена на другие, ученый обычно пытается реконструировать сеть регуляции транскрипции. Это может быть сделано путем интеграции данных в динамические модели, поддерживаемые справочной литературой или публичной информацией. базы данных, в сочетании с результатами кластеризации.[7] Моделирование может быть выполнено Логическая сеть, к Обыкновенные дифференциальные уравнения или же Линейная регрессия модели, например Регрессия наименьшего угла, к Байесовская сеть или на основе Теория информации подходы.[8][9] Например, это может быть сделано путем применения алгоритма вывода на основе корреляции, как будет описано ниже, подход, который имеет все больший успех, поскольку размер доступных наборов микрочипов продолжает увеличиваться. [3][10][11]

Передача сигнала

Передача сигнала сети (очень важно в биологии рака). Белки - это узлы, а направленные края представляют собой взаимодействие, при котором биохимическая конформация ребенка изменяется под действием родителя (например, опосредовано фосфорилирование, убиквитилирование, метилирование и др.). Первичным входом в алгоритм вывода будут данные ряда экспериментов, измеряющих активацию / инактивацию белков (например, фосфорилирование / дефосфорилирование) для набора белков. Вывод о таких сигнальных сетях осложняется тем фактом, что общие концентрации сигнальных белков будут колебаться со временем из-за регуляции транскрипции и трансляции. Такое изменение может привести к статистическим сбивать с толку. Соответственно, для анализа таких наборов данных необходимо применять более сложные статистические методы.[12]

Метаболический

Метаболит сети. Метаболиты - это узлы, а ребра направлены. Первичным входом в алгоритм будут данные ряда экспериментов по измерению уровней метаболитов.

Белково-белковое взаимодействие

Сети белок-белкового взаимодействия также очень активно изучаются. Однако реконструкция этих сетей не использует вывод на основе корреляции в том смысле, который обсуждается для уже описанных сетей (взаимодействие не обязательно подразумевает изменение состояния белка), и описание такой реконструкции сети взаимодействия оставлено для других статей.

Смотрите также

Рекомендации

  1. ^ Меркателли, Даниэле; Скаламбра, Лаура; Триболи, Лука; Луч, Лес; Джорджи, Федерико М. (2020). «Ресурсы вывода регуляторной сети генов: практический обзор». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов. 1863 (6): 194430. Дои:10.1016 / j.bbagrm.2019.194430. ISSN  1874-9399. PMID  31678629.
  2. ^ Тьери П., Фарина Л., Петти М., Астольфи Л., Пачи П., Кастильоне Ф (2018). «Сетевой вывод и реконструкция в биоинформатике». Энциклопедия биоинформатики и вычислительной биологии. 2: 805–813. Дои:10.1016 / B978-0-12-809633-8.20290-2. ISBN  9780128114322.
  3. ^ а б Марбах Д., Костелло Дж. К., Кюффнер Р., Вега Н. М., Прилл Р. Дж., Камачо Д. М., Эллисон К. Р., Келлис М., Коллинз Дж. Дж., Столовицкий Г. (август 2012 г.). «Мудрость толпы для надежного вывода генной сети». Природные методы. 9 (8): 796–804. Дои:10.1038 / nmeth.2016. ЧВК  3512113. PMID  22796662.
  4. ^ Спрайты P, Glamour C, Scheines R (2000). Причинно-следственная связь, прогнозирование и поиск: адаптивные вычисления и машинное обучение (2-е изд.). MIT Press.
  5. ^ Оутс CJ, Мукерджи S (сентябрь 2012 г.). «Сетевой вывод и биологическая динамика». Летопись прикладной статистики. 6 (3): 1209–1235. arXiv:1112.1047. Дои:10.1214 / 11-AOAS532. ЧВК  3533376. PMID  23284600.
  6. ^ Guthke R, Möller U, Hoffmann M, Thies F, Töpfer S (апрель 2005 г.). «Реконструкция динамической сети на основе данных экспрессии генов применительно к иммунному ответу во время бактериальной инфекции». Биоинформатика. 21 (8): 1626–34. Дои:10.1093 / биоинформатика / bti226. PMID  15613398.
  7. ^ Hecker M, Lambeck S, Toepfer S, van Someren E, Guthke R (апрель 2009 г.). «Вывод регуляторной сети генов: интеграция данных в динамических моделях - обзор». Биосистемы. 96 (1): 86–103. Дои:10.1016 / j.biosystems.2008.12.004. PMID  19150482.
  8. ^ ван Сомерен Е.П., Весселс Л.Ф., Бэкер Э., Рейндерс М.Дж. (июль 2002 г.). «Генетическое сетевое моделирование». Фармакогеномика. 3 (4): 507–25. Дои:10.1517/14622416.3.4.507. PMID  12164774.
  9. ^ Банф, Майкл; Ри, Сын Ю. (январь 2017 г.). «Вычислительный вывод сетей регуляции генов: подходы, ограничения и возможности». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов. 1860 (1): 41–52. Дои:10.1016 / j.bbagrm.2016.09.003. ISSN  1874-9399. PMID  27641093.
  10. ^ Фейт Дж. Дж., Хайете Б., Таден Дж. Т., Могно И., Вежбовски Дж., Коттарел Дж., Касиф С., Коллинз Дж. Дж., Гарднер Т. С. (январь 2007 г.). «Крупномасштабное картирование и проверка регуляции транскрипции Escherichia coli на основе компендиума профилей экспрессии». PLOS Биология. 5 (1): e8. Дои:10.1371 / journal.pbio.0050008. ЧВК  1764438. PMID  17214507.
  11. ^ Хайете Б., Гарднер Т.С., Коллинз Дж. Дж. (2007). «Размер имеет значение: сетевой вывод решает масштаб генома». Молекулярная системная биология. 3 (1): 77. Дои:10.1038 / msb4100118. ЧВК  1828748. PMID  17299414.
  12. ^ Оутс CJ, Мукерджи S (2012). «Структурный вывод с использованием нелинейной динамики». Рабочий документ CRiSM. 12 (7).