База данных генных болезней - Gene Disease Database

RGD
Содержание
Описание	В База данных генома крысы
Организмы	Раттус норвегикус (крыса)
Контакт
Исследовательский центр	Медицинский колледж Висконсина
Лаборатория	Центр молекулярной и генетики человека
Авторы	Мэри Э. Симояма, доктор философии; Ховард Дж. Джейкоб, доктор философии
Основное цитирование	PMID 25355511
Доступ
Интернет сайт	rgd.mcw.edu
Скачать URL	Выпуск данных RGD

UniProt
Содержание
Описание	UniProt это универсальный белок ресурс, центральное хранилище белок данные, созданные путем объединения Swiss-Prot, TrEMBL и PIR-PSD базы данных.
Типы данных; захвачен	Аннотации белков
Организмы	Все
Контакт
Исследовательский центр	EMBL-EBI, ВЕЛИКОБРИТАНИЯ; SIB, Швейцария; PIR, НАС.
Основное цитирование	Текущие и будущие разработки Universal Protein Resource
Доступ
Формат данных	Пользовательский плоский файл, ФАСТА, GFF, RDF, XML.
Интернет сайт	www.uniprot.org; www.uniprot.org/Новости/
Скачать URL	www.uniprot.org/ загрузки & для загрузки полных наборов данных ftp.uniprot.org
веб-сервис URL	Да - ЯВА API см. информацию здесь & ОТДЫХ см. информацию здесь
Инструменты
Интернет	Расширенный поиск, ВЗРЫВ, Clustal O, массовое получение / загрузка, сопоставление идентификаторов
Разное
Лицензия	Creative Commons Attribution-NoDerivs
Управление версиями	да
Выпуск данных; частота	4 недели
Политика курирования	Да - ручной и автоматический. Правила автоматического аннотирования, создаваемые кураторами баз данных и вычислительными алгоритмами.
Закладки; сущности	Да - как отдельные записи белков, так и поиск

База данных генных болезней
Классификация	Биоинформатика
Подклассификация	Базы данных
Тип баз данных	Биологические
Подтип баз данных	Генное заболевание

В биоинформатика, а База данных генных болезней представляет собой систематизированный набор данных, обычно структурированный для моделирования аспектов реальности таким образом, чтобы понять лежащие в основе механизмы сложных заболеваний, путем понимания множественных сложных взаимодействий между фенотип -генотип взаимоотношения и механизмы генетического заболевания.^[1] Базы данных по генным заболеваниям объединяют ассоциации генов и болезней человека из различных баз данных, созданных экспертами, и интеллектуальный анализ текста производные ассоциации, включая менделевские, комплексные и экологические заболевания.^[2]^[3]

Вступление

Специалисты в разных областях биологии и биоинформатика долгое время пытались понять молекулярные механизмы заболеваний для разработки профилактических и терапевтических стратегий. В отношении некоторых болезней стало очевидным, что враждебности достаточно для того, чтобы не получить индекс генов, связанных с заболеванием, а выяснить, как нарушения молекулярных решеток в клетке вызывают фенотипы болезни.^[4] Более того, даже при беспрецедентном объеме доступной информации получить такие каталоги крайне сложно.

Генетический Вообще говоря, генетические заболевания вызываются отклонениями в генах или хромосомы. Многие генетические заболевания развиваются еще до рождения. Генетические нарушения составляют значительную часть проблем здравоохранения в нашем обществе. Прогресс в понимании этой болезни увеличил продолжительность и качество жизни многих людей, страдающих генетическими нарушениями. Недавние разработки в области биоинформатики и лабораторной генетики позволили лучше разграничить определенные синдромы пороков развития и умственной отсталости, чтобы можно было понять их способ наследования. Эта информация позволяет генетическому консультанту предсказать риск возникновения большого количества генетических нарушений.^[2] Однако большая часть генетического консультирования проводится только после того, как рождение хотя бы одного больного человека предупредило семью об их склонности иметь детей с генетическим заболеванием. Связь одного гена с заболеванием встречается редко, и генетическое заболевание может быть или не быть трансмиссивным расстройством.^[5] Некоторые генетические заболевания передаются по наследству от генов родителей, но другие вызываются новыми мутации или изменения в ДНК. В других случаях та же болезнь, например, некоторые формы карцинома или же меланома, может быть результатом врожденного состояния у одних людей, новых изменений у других людей и негенетических причин у других людей.^[6]

Известно более шести тысяч моногенных заболеваний (моногенных), которые встречаются примерно у 1 из 200 рождений.^[1] Как следует из их термина, эти заболевания вызваны мутацией в одном гене. Напротив, полигенные расстройства вызываются несколькими генами, регулярно в сочетании с факторами окружающей среды.^[7] Примеры генетических фенотипов включают: Болезнь Альцгеймера, рак груди, лейкемия, синдром Дауна, пороки сердца и глухота; поэтому необходима каталогизация для сортировки всех болезней, связанных с генами.

Проблемы с творчеством

Рабочий процесс определения приоритетов генов болезней человека: Типичные списки берутся из областей сцепления, хромосомных аберраций, локусов ассоциативного исследования, списков дифференцированно экспрессируемых генов или генов, идентифицированных с помощью вариантов секвенирования. В качестве альтернативы можно отдать приоритет полному геному, но тогда можно ожидать значительно больше ложноположительных результатов.

На разных этапах проекта любого генного заболевания молекулярные биологи необходимо выбрать, даже после тщательного статистического анализа данных, какие гены или белки провести дальнейшее экспериментальное исследование и опустить из-за ограниченных ресурсов. Вычислительные методы, которые объединяют сложные, разнородные наборы данных, такие как данные экспрессии, информация о последовательностях, функциональная аннотация и биомедицинская литература, позволяют расставлять приоритеты для генов для будущих исследований более осознанным образом. Такие методы могут существенно повысить результативность последующих исследований и становятся бесценными для исследователей. Итак, одна из основных проблем в биологических и биомедицинский исследование должно распознать основные механизмы, лежащие в основе этих сложных генетических фенотипов. Были потрачены большие усилия на поиск генов, связанных с болезнями.^[8]

Однако все больше данных указывает на то, что большинство болезней человека нельзя отнести к одному гену, а возникают из-за сложных взаимодействий между множеством генетических вариантов и факторами риска окружающей среды. Было разработано несколько баз данных, хранящих ассоциации между генами и заболеваниями, такие как база данных сравнительной токсикогеномики (CTD), онлайн-менделевское наследование у человека (OMIM), база данных генетических ассоциаций (GAD) или база данных генетических ассоциаций болезней (DisGeNET). Каждая из этих баз данных фокусируется на различных аспектах взаимосвязи фенотип-генотип, и из-за характера процесса курирования базы данных они не являются полными, но в некотором смысле они полностью дополняют друг друга.^[9]

Типы баз данных

По сути, существует четыре типа баз данных: кураторские базы данных, прогнозные базы данных, литературные базы данных и интегративные базы данных.^[1]

Курируемые базы данных

Термин курируемые данные относится к информации, которая может включать в себя самые сложные вычислительные форматы для структурированных данных, научных обновлений и тщательно отобранных знаний, которая была составлена и подготовлена под руководством одного или нескольких экспертов, которые считаются квалифицированными для участия в такой Мероприятия^[10] Подразумевается, что полученная база данных имеет высокое качество. Контраст здесь с данными, которые могли быть собраны с помощью некоторого автоматизированного процесса или с использованием данных особенно низкого или неподдерживаемого качества и, возможно, ненадежных.^[10] Некоторые из наиболее распространенных примеров: CTD и UNIPROT.

База данных сравнительной токсикогеномики (CTD)

В База данных сравнительной токсикогеномики, помогает понять влияние соединений окружающей среды на здоровье человека путем интеграции данных из тщательно подобранной научной литературы для описания биохимических взаимодействий с генами и белками, а также связей между болезнями и химическими веществами, а также болезнями и генами или белками.^[11] CTD содержит тщательно отобранные данные, определяющие межвидовые химические взаимодействия между генами и белками, а также ассоциации химикатов и генов с болезнями для освещения молекулярных механизмов, лежащих в основе изменчивой восприимчивости и болезней, вызываемых окружающей средой. Эти данные позволяют проникнуть в суть сложных сетей взаимодействия химикатов, генов и белков. Одним из основных источников в этой базе данных является курированная информация от OMIM.^[11]

CTD - это уникальный ресурс, где специалисты по биоинформатике читают научную литературу и вручную обрабатывают четыре типа основных данных:

Химико-генные взаимодействия
Ассоциации химических болезней
Ассоциации генных болезней
Химико-фенотипические ассоциации

Универсальный белковый ресурс (UNIPROT)

Универсальный протеиновый ресурс (UniProt ) является всеобъемлющим ресурсом для данных о последовательности белков и аннотациях. Это исчерпывающая, первоклассная и свободно доступная база данных последовательностей белков и функциональной информации, многие записи которой получены из геном секвенирование проектов. Он содержит большой объем информации о биологической функции белков, взятой из исследовательской литературы, которая может указывать на прямую связь между геном, белком и болезнью.^[12]

Процесс компиляции и курирования базы данных
Кураторские данные могут включать процесс от практического опыта и обзора литературы до публикации базы данных в Интернете.^[14]

Прогнозные базы данных

База данных прогнозирования основана на статистических выводах. Один конкретный подход к такому выводу известен как прогнозирующий вывод, но прогнозирование может быть выполнено в рамках любого из нескольких подходов к статистическому выводу. Действительно, одно из описаний биостатистики заключается в том, что она обеспечивает средство передачи знаний об образце генетической популяции всей популяции (геномика ), а также к другим родственным генам или геномам, что не обязательно совпадает с предсказанием во времени.^[15] Когда информация передается во времени, часто в определенные моменты времени, этот процесс известен как прогнозирование. Три основных примера баз данных, которые можно рассматривать в этой категории, включают: База данных генома мыши (MGD), База данных генома крысы (RGD), OMIM и инструмент SIFT от Ensembl.^[1]

База данных генома мышей (MGD)

База данных генома мышей (MGD) - это ресурс международного сообщества, содержащий интегрированные генетические, геномные и биологические данные о лабораторных мышах. MGD обеспечивает полную аннотацию фенотипов и ассоциаций болезней человека для моделей мышей (генотипов) с использованием терминов из онтологии фенотипов млекопитающих и названий болезней из OMIM.^[16]

База данных генома крыс (RGD)

В База данных генома крысы (RGD) зародилась как совместная работа ведущих исследовательских институтов, занимающихся генетическими и геномными исследованиями крыс. Крыса по-прежнему широко используется исследователями в качестве модельного организма для изучения биологии и патофизиологии болезней. В последние несколько лет наблюдается стремительный рост генетических и геномных данных крыс.^[17] Этот информационный взрыв высветил необходимость в централизованной базе данных для эффективного и действенного сбора, управления и распространения этих данных среди исследователей по всему миру. База данных генома крыс была создана, чтобы служить хранилищем генетических и геномных данных крыс, а также картографической, штаммовой и физиологической информации. Он также облегчает исследовательские работы, предоставляя инструменты для поиска, анализа и прогнозирования этих данных.^[17]

Данные RGD, полезные для исследователей, изучающих гены болезней, включают аннотации болезней для генов крыс, мышей и человека. Аннотации подбираются вручную из литературы или загружаются с помощью автоматизированных конвейеров из других баз данных по заболеваниям. Загруженные аннотации сопоставляются с тем же словарем болезней, который используется для ручных аннотаций, чтобы обеспечить единообразие в наборе данных. RGD также поддерживает количественные данные фенотипа, связанные с заболеванием, для крыс (PhenoMiner).^[18]

Онлайн-менделевское наследование в человеке (OMIM )

Онлайн-менделевское наследование в человеке
Содержание
Описание	OMIM - это сборник человеческих генов и генетических фенотипов.
Организмы	Человек (Х. Сапиенс)
Контакт
Исследовательский центр	NCBI
Основное цитирование	PMID 25398906
Доступ
Интернет сайт	www.ncbi.nlm.Национальные институты здравоохранения США.gov/ omim

При поддержке NCBI, онлайн-менделевское наследование в человеке (OMIM) представляет собой базу данных, в которой каталогизируются все известные болезни с генетическим компонентом, прогнозируется их связь с соответствующими генами в геноме человека, а также содержатся ссылки для дальнейших исследований и инструменты для геномного анализа. каталогизированного гена.^[19] OMIM - это всеобъемлющий авторитетный сборник человеческих генов и генетических фенотипов, который находится в свободном доступе и ежедневно обновляется. База данных использовалась как ресурс для прогнозирования соответствующей информации для унаследованных состояний.^[19]

Однородность пути по сравнению с ассоциированными генами Демонстрируя концепцию того, что болезни имеют большую связь с множеством генов, средние значения однородности путей для отдельных заболеваний и случайных контрольных групп нанесены на график для четырех сетей, разделенных на количество связанных генных продуктов для каждой болезни. Этот график показывает, насколько сложно сопоставить большее количество заболеваний с соответствием в 4 разных базах данных, поэтому базы данных по генным заболеваниям проверяют эти отношения.

Инструмент Ensembl SIFT

Проект базы данных генома Ensembl.

Содержание
Описание	Ансамбль
Контакт
Исследовательский центр	Wellcome Trust Sanger Institute Европейский институт биоинформатики
Основное цитирование	Хаббард, и другие. (2002)^[20]
Доступ
Интернет сайт	www.ensembl.org

Это один из крупнейших ресурсов, доступных для всех геномных и генетических исследований, он предоставляет централизованный ресурс для генетиков, молекулярных биологов и других исследователей, изучающих геномы наших собственных видов и других позвоночных, а также модельных болезнетворных организмов. Ансамбль является одним из нескольких хорошо известных браузеров генома для поиска информации о геномных заболеваниях. Ensembl импортирует данные об изменениях из множества различных источников, Ensembl прогнозирует влияние вариантов.^[21] Для каждой вариации, которая сопоставлена с эталонным геномом, идентифицируется каждый транскрипт Ensembl, который перекрывает вариацию. Затем он использует подход, основанный на правилах, для прогнозирования воздействия каждого аллеля вариации на транскрипт. Набор терминов последствий, определенных онтологией последовательностей (SO), в настоящее время может быть назначен каждой комбинации аллеля и транскрипта. Каждый аллель каждой вариации может по-разному влиять на разные транскрипты. Для прогнозирования человеческих мутаций в базе данных Ensembl используется множество различных инструментов, одним из наиболее широко используемых является SIFT, который предсказывает, может ли аминокислотная замена повлиять на функцию белка на основе гомологии последовательностей и физико-химического сходства между альтернативные аминокислоты. Данные, представленные для каждой аминокислотной замены, представляют собой оценку и качественный прогноз («переносимый» или «вредный»). Оценка - это нормализованная вероятность того, что замена аминокислоты переносится, поэтому оценка, близкая к 0, с большей вероятностью будет вредной. Качественный прогноз выводится из этой оценки, так что замены с оценкой <0,05 называются «вредными», а все другие - «допустимыми». SIFT может применяться к встречающимся в природе несинонимичным полиморфизмам и лабораторно-индуцированным миссенс-мутациям, которые приведут к построению взаимосвязей в характеристиках фенотипа, протеомика и геномика.^[21]

Литературные базы данных

В такого рода базах данных собраны книги, статьи, книжные обзоры, диссертации и аннотации о базах данных по генетическим заболеваниям. Некоторые из следующих являются примерами этого типа: GAD, LGHDN и BeFree Data.

База данных генетической ассоциации (GAD)

База данных генетических ассоциаций - это архив исследований генетических ассоциаций человека сложных заболеваний. GAD в первую очередь ориентирован на архивирование информации об общих сложных заболеваниях человека, а не о редких менделевских расстройствах, как это обнаруживается в OMIM. Он включает кураторские сводные данные, извлеченные из опубликованных статей в рецензируемых журналах по исследованиям генов-кандидатов и общегеномным ассоциациям (GWAS ).^[22] GAD был заморожен по состоянию на 01.09.2014, но все еще доступен для загрузки.^[23]

Сеть генетических заболеваний человека, полученная из литературы (LHGDN)

Созданная из литературы сеть генов-болезней человека (LHGDN) представляет собой базу данных, основанную на интеллектуальном анализе текста, с упором на извлечение и классификацию ассоциаций ген-болезнь в отношении нескольких биомолекулярных состояний. Он использует алгоритм, основанный на машинном обучении, для извлечения семантических отношений ген-болезнь из интересующего текстового источника. Это часть Linked Life Data LMU в Мюнхене, Германия.^[1]

Данные BeFree

Извлекает ассоциации "ген-болезнь" из аннотации MEDLINE с помощью системы BeFree. BeFree состоит из модуля биомедицинского распознавания именованных сущностей (BioNER) для обнаружения заболеваний и генов и модуля извлечения отношений на основе морфосинтаксической информации.^[24]

Интегративные базы данных

Такие базы данных включают в себя менделевские, комплексные и экологические болезни в интегрированном архиве ассоциаций генов и болезней и показывают, что концепция модульности применима ко всем из них. Они обеспечивают функциональный анализ болезней в случае важных новых биологических открытий, которые могут оказаться неприменимыми. обнаруживается при независимом рассмотрении каждой из ассоциаций ген-болезнь. Следовательно, они представляют собой подходящую основу для изучения того, как генетические факторы и факторы окружающей среды, такие как лекарства, способствуют развитию заболеваний. Лучшим примером для такого рода баз данных является DisGeNET.^[8]^[25]

База данных ассоциаций генных болезней DisGeNET

DisGeNET
Содержание
Описание	Объединяет ассоциации генов человека с заболеваниями
Типы данных захвачен	База данных ассоциаций
Организмы	Человек (Х. Сапиенс)
Контакт
Исследовательский центр	Программа исследований в области биомедицинской информатики (GRIB) IMIM-UPF
Лаборатория	Группа интегративной биомедицинской информатики
Авторы	Ферран Санс и Лаура И. Ферлонг (Пинеро и др., 2015)
Основное цитирование	PMID 25877637
Доступ
Интернет сайт	www.disgenet.org
Разное
Выпуск данных частота	ежегодный
Версия	3

DisGeNET представляет собой обширную базу данных ассоциаций генов и болезней, которая объединяет ассоциации из нескольких источников, охватывающих различные биомедицинские аспекты болезней.^[25] В частности, он сосредоточен на современных знаниях о генетических заболеваниях человека, включая менделевские, комплексные и экологические заболевания. Чтобы оценить концепцию модульности болезней человека, эта база данных выполняет систематическое изучение новых свойств сетей человеческих болезней с помощью топологии сети и анализа функциональных аннотаций.^[1] Результаты указывают на широко распространенное генетическое происхождение болезней человека и показывают, что для большинства заболеваний, включая менделевские, сложные и экологические, существуют функциональные модули. Более того, обнаружено, что основной набор биологических путей связан с большинством заболеваний человека. Получение аналогичных результатов при обучении кластеры Что касается болезней, результаты этой базы данных позволяют предположить, что связанные заболевания могут возникать из-за дисфункции общих биологических процессов в клетке. Сетевой анализ этой интегрированной базы данных указывает на то, что интеграция данных необходима для получения всеобъемлющего представления о генетическом ландшафте болезней человека и что генетическое происхождение сложных заболеваний встречается гораздо чаще, чем ожидалось.^[1]

Онтология ассоциации генов DisGeNET
Описание каждого типа ассоциации в этой онтологии: # Терапевтическая ассоциация: ген / белок играет терапевтическую роль в облегчении заболевания. #Biomarker Association: ген / белок либо играет роль в этиологии заболевания (например, участвует в молекулярном механизме, который приводит к заболеванию), либо является биомаркером заболевания. # Genetic Variation Association: используется, когда вариация последовательности (мутация, SNP) связана с фенотипом заболевания, но все еще нет доказательств того, что вариация вызывает заболевание. В некоторых случаях наличие вариантов увеличивает восприимчивость к болезни. Как правило, предоставляются идентификаторы SNP NCBI. # Измененная ассоциация экспрессии: изменения функции белка посредством измененной экспрессии гена связаны с фенотипом заболевания. • Ассоциация посттрансляционных модификаций: изменения функции белка посредством посттрансляционных модификаций (метилирование или фосфорилирование белка) связаны с фенотипом заболевания. ^[1]

Некоторые варианты использования

Некоторые из наиболее интересных случаев использования баз данных по генным заболеваниям можно найти в следующих статьях:^[1]^[8]

Сантьяго, Хосе А .; Поташкин, Джудит А. (2014). «Сетевой подход к клиническому вмешательству при нейродегенеративных заболеваниях». Тенденции в молекулярной медицине. 20 (12): 694–703. Дои:10.1016 / j.molmed.2014.10.002. PMID 25455073.
Kaikkonen, Minna U .; Нисканен, Анри; Романоски, Кейси Э .; Кансанен, Эмилия; Kivelä, Annukka M .; Лайталайнен, Яркко; Хайнц, Свен; Беннер, Кристофер; Стекло, Кристофер К .; Юля-Херттуала, Сеппо (2014). «Контроль программ транскрипции VEGF-A с помощью пауз и геномной компартментализации». Исследования нуклеиновых кислот. 42 (20): 12570–12584. Дои:10.1093 / нар / gku1036. ЧВК 4227755. PMID 25352550.
Гросдидье, Солен; Феррер, Антони; Фанер, Роза; Пиньеро, Джанет; Рока, Хосеп; Cosío, Borja; Агусти, Альвар; Геа, Хоаким; Санс, Ферран; Ферлонг, Лаура И. (2014). «Сетевой медицинский анализ мультиморбидности ХОБЛ». Респираторные исследования. 15: 111. Дои:10.1186 / s12931-014-0111-4. ЧВК 4177421. PMID 25248857.
Криштиану, Франческа; Велтри, Пьеранджело (2014). «Инструмент на основе R для анализа данных miRNA и корреляции с клиническими онтологиями». Материалы 5-й конференции ACM по биоинформатике, вычислительной биологии и информатике здравоохранения - BCB '14. С. 768–773. Дои:10.1145/2649387.2660847. ISBN 9781450328944.
Галлахер, Сюзанна Реник; Домбровер, Мика; Гольдберг, Дебра С. (2014). «Использование коэффициентов кластеризации 2-узлового гиперграфа для анализа сетей болезни-гена». Материалы 5-й конференции ACM по биоинформатике, вычислительной биологии и информатике здравоохранения - BCB '14. С. 647–648. Дои:10.1145/2649387.2660817. ISBN 9781450328944.
Маннил, Дипти; Фогт, Инго; Принц, Жанетт; Кампильос, Моника (2015). «База данных неоднородности систем органов: база данных для визуализации фенотипов на уровне систем органов». Исследования нуклеиновых кислот. 43 (Проблема с базой данных): D900 – D906. Дои:10.1093 / нар / gku948. ЧВК 4384019. PMID 25313158.
Фогт, Инго; Принц, Жанетт; Кампильос, Моника (2014). «Молекулярно и клинически родственные лекарства и заболевания обогащены фенотипически подобными парами лекарство-заболевание». Геномная медицина. 6 (7). Дои:10.1186 / s13073-014-0052-z.
Сантьяго, Хосе А .; Поташкин, Джудит А. (2014). «Системные подходы к расшифровке молекулярных связей при болезни Паркинсона и диабете». Нейробиология болезней. 72: 84–91. Дои:10.1016 / j.nbd.2014.03.019. PMID 24718034.
Ли, Ин-Хи; Ли, Кёнджун; Hsing, Майкл; Чхве, Ёнджун; Пак, Джин-Хо; Ким, Шу Хи; Бон, Джастин М .; Neu, Matthew B .; Хван, Кю-Бэк; Грин, Роберт С.; Kohane, Isaac S .; Конг, Сек Вон (2014). «Приоритетность вариантов, генов и путей, связанных с заболеванием, с помощью интерактивного конвейера анализа всего генома». Человеческая мутация. 35 (5): 537–547. Дои:10.1002 / humu.22520. ЧВК 4130156. PMID 24478219.
Лю, Мин-Си; Чен, Син; Чен, Гэн; Цуй, Цин-Хуа; Ян, Гуй-Ин (2014). «Вычислительная основа для определения длинных некодирующих РНК, ассоциированных с заболеваниями человека». PLOS One. 9 (1): e84408. Bibcode:2014PLoSO ... 984408L. Дои:10.1371 / journal.pone.0084408. ЧВК 3879311. PMID 24392133.
Чжао, Илей; Ван, Чен; У, Цзяньвэй; Ван, Ян; Чжу, Вэньлянь; Чжан, Юн; Ду, Чжимин (2013). «Холин защищает от гипертрофии сердца, вызванной усилением постнагрузки». Международный журнал биологических наук. 9 (3): 295–302. Дои:10.7150 / ijbs.5976. ЧВК 3596715. PMID 23493786.
Кочор, Кристофер А .; Ли, Ева К .; Торрес, Ребекка А .; Бойд, Эми; Вега, Дж. Дэвид; Уппал, Каран; Юань, Фань; Филдс, Эрл Дж .; Samarel, Allen M .; Льюис, Уильям (2013). «Обнаружение дифференциально метилированных промоторов генов в миокарде левого желудочка человека с отказом и без сбоя с помощью вычислительного анализа». Физиологическая геномика. 45 (14): 597–605. Дои:10.1152 / физиолгеномика.00013.2013. ЧВК 3727018. PMID 23695888.
Гу, Инь; Лю, Гуан-Хуэй; Плонгтонгкум, нонглюк; Беннер, Кристофер; Йи, Фэй; Цюй, Цзин; Сузуки, Кейитиро; Ян, Цзипин; Чжан, Вэйци; Ли, Мо; Монтсеррат, Нурия; Креспо, Исаак; Дель Соль, Антонио; Эстебан, Консепсьон Родригес; Чжан, Кун; Изписуа Бельмонте, Хуан Карлос (2014). «Глобальное метилирование ДНК и анализ транскрипции кардиомиоцитов, полученных из ЭСК человека». Белки и клетки. 5: 59–68. Дои:10.1007 / s13238-013-0016-х. ЧВК 3938846. PMID 24474197.
Гальхардо, Мафальда; Синкконен, Лассе; Бернингер, Филипп; Лин, Джейк; Заутер, Томас; Хейняниеми, Мерья (2014). «Комплексный анализ регуляции метаболизма на уровне транскриптов позволяет выявить узлы метаболической сети человека, имеющие отношение к заболеванию». Исследования нуклеиновых кислот. 42 (3): 1474–1496. Дои:10.1093 / nar / gkt989. ЧВК 3919568. PMID 24198249.
Тьери, Паоло; Терманини, Альберто; Беллависта, Елена; Сальвиоли, Стефано; Капри, Мириам; Франчески, Клаудио (2012). «Составление интерактивной карты пути NF-κB». PLOS One. 7 (3): e32678. Bibcode:2012PLoSO ... 732678T. Дои:10.1371 / journal.pone.0032678. ЧВК 3293857. PMID 22403694.

Замечания о будущем в базах данных по генным болезням

Взаимоотношения при генных заболеваниях

Завершение генома человека изменило способ поиска генов болезней. Раньше подход заключался в том, чтобы сосредоточиться на одном или нескольких генах одновременно. Теперь такие проекты, как DisGeNET, служат примером усилий по систематическому анализу всех генных изменений, связанных с одним или несколькими заболеваниями.^[26] Следующим шагом является создание полной картины механистических аспектов болезней и разработка лекарств против них. Для этого потребуется сочетание двух подходов: систематический поиск и углубленное изучение каждого гена. Будущее области будет определяться новыми методами интеграции больших массивов данных из разных источников и включения функциональной информации в анализ крупномасштабных данных, полученных в результате биоинформатических исследований.^[1]

Биоинформатика - это и термин, обозначающий совокупность исследований биологических генных заболеваний, в которых компьютерное программирование используется как часть своей методологии, а также ссылка на конкретные аналитические конвейеры, которые используются неоднократно, особенно в областях генетики и геномики.^[1] Обычно биоинформатика используется для идентификации генов-кандидатов и нуклеотидов, SNP. Часто такая идентификация проводится с целью лучшего понимания генетической основы болезни, уникальных приспособлений, желаемых свойств или различий между популяциями. Менее формально биоинформатика также пытается понять организационные принципы в последовательностях нуклеиновых кислот и белков.^[1]

Реакция биоинформатики на новые экспериментальные методы открывает новую перспективу в анализе экспериментальных данных, о чем свидетельствуют достижения в анализе информации из баз данных о генных заболеваниях и других технологий. Ожидается, что эта тенденция продолжится с использованием новых подходов к ответу на новые методы, такие как технологии секвенирования следующего поколения. Например, наличие большого количества индивидуальных геномов человека будет способствовать развитию компьютерного анализа редких вариантов, включая статистический анализ их отношения к образу жизни, взаимодействию лекарств и другим факторам.^[1]Биомедицинские исследования также будут определяться нашей способностью эффективно извлекать большой объем существующих и постоянно генерируемых биомедицинских данных. В частности, методы интеллектуального анализа текста в сочетании с другими молекулярными данными могут предоставить информацию о генных мутациях и взаимодействиях и станут критически важными для того, чтобы опережать экспоненциальный рост данных, генерируемых в биомедицинских исследованиях. Еще одна область, которая извлекает выгоду из достижений в разработке и интеграции молекулярного, клинического и лекарственного анализа, - это фармакогеномика. In silico изучение взаимосвязи между человеческими вариациями и их влиянием на болезни будет ключом к развитию персонализированной медицины.^[8]Таким образом, базы данных по генным заболеваниям уже изменили поиск генов болезней и могут стать важным компонентом других областей медицинских исследований.^[1]