База данных генных болезней - Gene Disease Database

База данных генных болезней
КлассификацияБиоинформатика
ПодклассификацияБазы данных
Тип баз данныхБиологические
Подтип баз данныхГенное заболевание

В биоинформатика, а База данных генных болезней представляет собой систематизированный набор данных, обычно структурированный для моделирования аспектов реальности таким образом, чтобы понять лежащие в основе механизмы сложных заболеваний, путем понимания множественных сложных взаимодействий между фенотип -генотип взаимоотношения и механизмы генетического заболевания.[1] Базы данных по генным заболеваниям объединяют ассоциации генов и болезней человека из различных баз данных, созданных экспертами, и интеллектуальный анализ текста производные ассоциации, включая менделевские, комплексные и экологические заболевания.[2][3]

Вступление

Специалисты в разных областях биологии и биоинформатика долгое время пытались понять молекулярные механизмы заболеваний для разработки профилактических и терапевтических стратегий. В отношении некоторых болезней стало очевидным, что враждебности достаточно для того, чтобы не получить индекс генов, связанных с заболеванием, а выяснить, как нарушения молекулярных решеток в клетке вызывают фенотипы болезни.[4] Более того, даже при беспрецедентном объеме доступной информации получить такие каталоги крайне сложно.

Генетический Вообще говоря, генетические заболевания вызываются отклонениями в генах или хромосомы. Многие генетические заболевания развиваются еще до рождения. Генетические нарушения составляют значительную часть проблем здравоохранения в нашем обществе. Прогресс в понимании этой болезни увеличил продолжительность и качество жизни многих людей, страдающих генетическими нарушениями. Недавние разработки в области биоинформатики и лабораторной генетики позволили лучше разграничить определенные синдромы пороков развития и умственной отсталости, чтобы можно было понять их способ наследования. Эта информация позволяет генетическому консультанту предсказать риск возникновения большого количества генетических нарушений.[2] Однако большая часть генетического консультирования проводится только после того, как рождение хотя бы одного больного человека предупредило семью об их склонности иметь детей с генетическим заболеванием. Связь одного гена с заболеванием встречается редко, и генетическое заболевание может быть или не быть трансмиссивным расстройством.[5] Некоторые генетические заболевания передаются по наследству от генов родителей, но другие вызываются новыми мутации или изменения в ДНК. В других случаях та же болезнь, например, некоторые формы карцинома или же меланома, может быть результатом врожденного состояния у одних людей, новых изменений у других людей и негенетических причин у других людей.[6]

Известно более шести тысяч моногенных заболеваний (моногенных), которые встречаются примерно у 1 из 200 рождений.[1] Как следует из их термина, эти заболевания вызваны мутацией в одном гене. Напротив, полигенные расстройства вызываются несколькими генами, регулярно в сочетании с факторами окружающей среды.[7] Примеры генетических фенотипов включают: Болезнь Альцгеймера, рак груди, лейкемия, синдром Дауна, пороки сердца и глухота; поэтому необходима каталогизация для сортировки всех болезней, связанных с генами.

Проблемы с творчеством

A Gene prioritization
Рабочий процесс определения приоритетов генов болезней человека: Типичные списки берутся из областей сцепления, хромосомных аберраций, локусов ассоциативного исследования, списков дифференцированно экспрессируемых генов или генов, идентифицированных с помощью вариантов секвенирования. В качестве альтернативы можно отдать приоритет полному геному, но тогда можно ожидать значительно больше ложноположительных результатов.

На разных этапах проекта любого генного заболевания молекулярные биологи необходимо выбрать, даже после тщательного статистического анализа данных, какие гены или белки провести дальнейшее экспериментальное исследование и опустить из-за ограниченных ресурсов. Вычислительные методы, которые объединяют сложные, разнородные наборы данных, такие как данные экспрессии, информация о последовательностях, функциональная аннотация и биомедицинская литература, позволяют расставлять приоритеты для генов для будущих исследований более осознанным образом. Такие методы могут существенно повысить результативность последующих исследований и становятся бесценными для исследователей. Итак, одна из основных проблем в биологических и биомедицинский исследование должно распознать основные механизмы, лежащие в основе этих сложных генетических фенотипов. Были потрачены большие усилия на поиск генов, связанных с болезнями.[8]

Однако все больше данных указывает на то, что большинство болезней человека нельзя отнести к одному гену, а возникают из-за сложных взаимодействий между множеством генетических вариантов и факторами риска окружающей среды. Было разработано несколько баз данных, хранящих ассоциации между генами и заболеваниями, такие как база данных сравнительной токсикогеномики (CTD), онлайн-менделевское наследование у человека (OMIM), база данных генетических ассоциаций (GAD) или база данных генетических ассоциаций болезней (DisGeNET). Каждая из этих баз данных фокусируется на различных аспектах взаимосвязи фенотип-генотип, и из-за характера процесса курирования базы данных они не являются полными, но в некотором смысле они полностью дополняют друг друга.[9]

Типы баз данных

По сути, существует четыре типа баз данных: кураторские базы данных, прогнозные базы данных, литературные базы данных и интегративные базы данных.[1]

Курируемые базы данных

Термин курируемые данные относится к информации, которая может включать в себя самые сложные вычислительные форматы для структурированных данных, научных обновлений и тщательно отобранных знаний, которая была составлена ​​и подготовлена ​​под руководством одного или нескольких экспертов, которые считаются квалифицированными для участия в такой Мероприятия[10] Подразумевается, что полученная база данных имеет высокое качество. Контраст здесь с данными, которые могли быть собраны с помощью некоторого автоматизированного процесса или с использованием данных особенно низкого или неподдерживаемого качества и, возможно, ненадежных.[10] Некоторые из наиболее распространенных примеров: CTD и UNIPROT.

База данных сравнительной токсикогеномики (CTD)

В База данных сравнительной токсикогеномики, помогает понять влияние соединений окружающей среды на здоровье человека путем интеграции данных из тщательно подобранной научной литературы для описания биохимических взаимодействий с генами и белками, а также связей между болезнями и химическими веществами, а также болезнями и генами или белками.[11] CTD содержит тщательно отобранные данные, определяющие межвидовые химические взаимодействия между генами и белками, а также ассоциации химикатов и генов с болезнями для освещения молекулярных механизмов, лежащих в основе изменчивой восприимчивости и болезней, вызываемых окружающей средой. Эти данные позволяют проникнуть в суть сложных сетей взаимодействия химикатов, генов и белков. Одним из основных источников в этой базе данных является курированная информация от OMIM.[11]

CTD - это уникальный ресурс, где специалисты по биоинформатике читают научную литературу и вручную обрабатывают четыре типа основных данных:

  • Химико-генные взаимодействия
  • Ассоциации химических болезней
  • Ассоциации генных болезней
  • Химико-фенотипические ассоциации

Универсальный белковый ресурс (UNIPROT)

Универсальный протеиновый ресурс (UniProt ) является всеобъемлющим ресурсом для данных о последовательности белков и аннотациях. Это исчерпывающая, первоклассная и свободно доступная база данных последовательностей белков и функциональной информации, многие записи которой получены из геном секвенирование проектов. Он содержит большой объем информации о биологической функции белков, взятой из исследовательской литературы, которая может указывать на прямую связь между геном, белком и болезнью.[12]

UniProt
Содержание
ОписаниеUniProt это универсальный белок ресурс, центральное хранилище белок данные, созданные путем объединения Swiss-Prot, TrEMBL и PIR-PSD базы данных.
Типы данных
захвачен
Аннотации белков
ОрганизмыВсе
Контакт
Исследовательский центрEMBL-EBI, ВЕЛИКОБРИТАНИЯ; SIB, Швейцария; PIR, НАС.
Основное цитированиеТекущие и будущие разработки Universal Protein Resource[13]
Доступ
Формат данныхПользовательский плоский файл, ФАСТА, GFF, RDF, XML.
Интернет сайтwww.uniprot.org
www.uniprot.org/Новости/
Скачать URLwww.uniprot.org/ загрузки & для загрузки полных наборов данных ftp.uniprot.org
веб-сервис URLДа - ЯВА API см. информацию здесь & ОТДЫХ см. информацию здесь
Инструменты
ИнтернетРасширенный поиск, ВЗРЫВ, Clustal O, массовое получение / загрузка, сопоставление идентификаторов
Разное
ЛицензияCreative Commons Attribution-NoDerivs
Управление версиямида
Выпуск данных
частота
4 недели
Политика курированияДа - ручной и автоматический. Правила автоматического аннотирования, создаваемые кураторами баз данных и вычислительными алгоритмами.
Закладки
сущности
Да - как отдельные записи белков, так и поиск
Процесс компиляции и курирования базы данных
Кураторские данные могут включать процесс от практического опыта и обзора литературы до публикации базы данных в Интернете.[14]

Прогнозные базы данных

База данных прогнозирования основана на статистических выводах. Один конкретный подход к такому выводу известен как прогнозирующий вывод, но прогнозирование может быть выполнено в рамках любого из нескольких подходов к статистическому выводу. Действительно, одно из описаний биостатистики заключается в том, что она обеспечивает средство передачи знаний об образце генетической популяции всей популяции (геномика ), а также к другим родственным генам или геномам, что не обязательно совпадает с предсказанием во времени.[15] Когда информация передается во времени, часто в определенные моменты времени, этот процесс известен как прогнозирование. Три основных примера баз данных, которые можно рассматривать в этой категории, включают: База данных генома мыши (MGD), База данных генома крысы (RGD), OMIM и инструмент SIFT от Ensembl.[1]

База данных генома мышей (MGD)

База данных генома мышей (MGD) - это ресурс международного сообщества, содержащий интегрированные генетические, геномные и биологические данные о лабораторных мышах. MGD обеспечивает полную аннотацию фенотипов и ассоциаций болезней человека для моделей мышей (генотипов) с использованием терминов из онтологии фенотипов млекопитающих и названий болезней из OMIM.[16]

База данных генома крыс (RGD)

RGD
Содержание
ОписаниеВ База данных генома крысы
ОрганизмыРаттус норвегикус (крыса)
Контакт
Исследовательский центрМедицинский колледж Висконсина
ЛабораторияЦентр молекулярной и генетики человека
АвторыМэри Э. Симояма, доктор философии; Ховард Дж. Джейкоб, доктор философии
Основное цитированиеPMID  25355511
Доступ
Интернет сайтrgd.mcw.edu
Скачать URLВыпуск данных RGD

В База данных генома крысы (RGD) зародилась как совместная работа ведущих исследовательских институтов, занимающихся генетическими и геномными исследованиями крыс. Крыса по-прежнему широко используется исследователями в качестве модельного организма для изучения биологии и патофизиологии болезней. В последние несколько лет наблюдается стремительный рост генетических и геномных данных крыс.[17] Этот информационный взрыв высветил необходимость в централизованной базе данных для эффективного и действенного сбора, управления и распространения этих данных среди исследователей по всему миру. База данных генома крыс была создана, чтобы служить хранилищем генетических и геномных данных крыс, а также картографической, штаммовой и физиологической информации. Он также облегчает исследовательские работы, предоставляя инструменты для поиска, анализа и прогнозирования этих данных.[17]

Данные RGD, полезные для исследователей, изучающих гены болезней, включают аннотации болезней для генов крыс, мышей и человека. Аннотации подбираются вручную из литературы или загружаются с помощью автоматизированных конвейеров из других баз данных по заболеваниям. Загруженные аннотации сопоставляются с тем же словарем болезней, который используется для ручных аннотаций, чтобы обеспечить единообразие в наборе данных. RGD также поддерживает количественные данные фенотипа, связанные с заболеванием, для крыс (PhenoMiner).[18]

Онлайн-менделевское наследование в человеке (OMIM )

Онлайн-менделевское наследование в человеке
Содержание
ОписаниеOMIM - это сборник человеческих генов и генетических фенотипов.
ОрганизмыЧеловек (Х. Сапиенс)
Контакт
Исследовательский центрNCBI
Основное цитированиеPMID  25398906
Доступ
Интернет сайтwww.ncbi.nlm.Национальные институты здравоохранения США.gov/ omim

При поддержке NCBI, онлайн-менделевское наследование в человеке (OMIM) представляет собой базу данных, в которой каталогизируются все известные болезни с генетическим компонентом, прогнозируется их связь с соответствующими генами в геноме человека, а также содержатся ссылки для дальнейших исследований и инструменты для геномного анализа. каталогизированного гена.[19] OMIM - это всеобъемлющий авторитетный сборник человеческих генов и генетических фенотипов, который находится в свободном доступе и ежедневно обновляется. База данных использовалась как ресурс для прогнозирования соответствующей информации для унаследованных состояний.[19]

A Pathway Hogeneity
Однородность пути по сравнению с ассоциированными генами Демонстрируя концепцию того, что болезни имеют большую связь с множеством генов, средние значения однородности путей для отдельных заболеваний и случайных контрольных групп нанесены на график для четырех сетей, разделенных на количество связанных генных продуктов для каждой болезни. Этот график показывает, насколько сложно сопоставить большее количество заболеваний с соответствием в 4 разных базах данных, поэтому базы данных по генным заболеваниям проверяют эти отношения.

Инструмент Ensembl SIFT

Проект базы данных генома Ensembl.
Ensembl release58 sgcb screenshot.png
Содержание
ОписаниеАнсамбль
Контакт
Исследовательский центр
Основное цитированиеХаббард, и другие. (2002)[20]
Доступ
Интернет сайтwww.ensembl.org

Это один из крупнейших ресурсов, доступных для всех геномных и генетических исследований, он предоставляет централизованный ресурс для генетиков, молекулярных биологов и других исследователей, изучающих геномы наших собственных видов и других позвоночных, а также модельных болезнетворных организмов. Ансамбль является одним из нескольких хорошо известных браузеров генома для поиска информации о геномных заболеваниях. Ensembl импортирует данные об изменениях из множества различных источников, Ensembl прогнозирует влияние вариантов.[21] Для каждой вариации, которая сопоставлена ​​с эталонным геномом, идентифицируется каждый транскрипт Ensembl, который перекрывает вариацию. Затем он использует подход, основанный на правилах, для прогнозирования воздействия каждого аллеля вариации на транскрипт. Набор терминов последствий, определенных онтологией последовательностей (SO), в настоящее время может быть назначен каждой комбинации аллеля и транскрипта. Каждый аллель каждой вариации может по-разному влиять на разные транскрипты. Для прогнозирования человеческих мутаций в базе данных Ensembl используется множество различных инструментов, одним из наиболее широко используемых является SIFT, который предсказывает, может ли аминокислотная замена повлиять на функцию белка на основе гомологии последовательностей и физико-химического сходства между альтернативные аминокислоты. Данные, представленные для каждой аминокислотной замены, представляют собой оценку и качественный прогноз («переносимый» или «вредный»). Оценка - это нормализованная вероятность того, что замена аминокислоты переносится, поэтому оценка, близкая к 0, с большей вероятностью будет вредной. Качественный прогноз выводится из этой оценки, так что замены с оценкой <0,05 называются «вредными», а все другие - «допустимыми». SIFT может применяться к встречающимся в природе несинонимичным полиморфизмам и лабораторно-индуцированным миссенс-мутациям, которые приведут к построению взаимосвязей в характеристиках фенотипа, протеомика и геномика.[21]

Литературные базы данных

В такого рода базах данных собраны книги, статьи, книжные обзоры, диссертации и аннотации о базах данных по генетическим заболеваниям. Некоторые из следующих являются примерами этого типа: GAD, LGHDN и BeFree Data.

База данных генетической ассоциации (GAD)

База данных генетических ассоциаций - это архив исследований генетических ассоциаций человека сложных заболеваний. GAD в первую очередь ориентирован на архивирование информации об общих сложных заболеваниях человека, а не о редких менделевских расстройствах, как это обнаруживается в OMIM. Он включает кураторские сводные данные, извлеченные из опубликованных статей в рецензируемых журналах по исследованиям генов-кандидатов и общегеномным ассоциациям (GWAS ).[22] GAD был заморожен по состоянию на 01.09.2014, но все еще доступен для загрузки.[23]

Сеть генетических заболеваний человека, полученная из литературы (LHGDN)

Созданная из литературы сеть генов-болезней человека (LHGDN) представляет собой базу данных, основанную на интеллектуальном анализе текста, с упором на извлечение и классификацию ассоциаций ген-болезнь в отношении нескольких биомолекулярных состояний. Он использует алгоритм, основанный на машинном обучении, для извлечения семантических отношений ген-болезнь из интересующего текстового источника. Это часть Linked Life Data LMU в Мюнхене, Германия.[1]

Данные BeFree

Извлекает ассоциации "ген-болезнь" из аннотации MEDLINE с помощью системы BeFree. BeFree состоит из модуля биомедицинского распознавания именованных сущностей (BioNER) для обнаружения заболеваний и генов и модуля извлечения отношений на основе морфосинтаксической информации.[24]

Интегративные базы данных

Такие базы данных включают в себя менделевские, комплексные и экологические болезни в интегрированном архиве ассоциаций генов и болезней и показывают, что концепция модульности применима ко всем из них. Они обеспечивают функциональный анализ болезней в случае важных новых биологических открытий, которые могут оказаться неприменимыми. обнаруживается при независимом рассмотрении каждой из ассоциаций ген-болезнь. Следовательно, они представляют собой подходящую основу для изучения того, как генетические факторы и факторы окружающей среды, такие как лекарства, способствуют развитию заболеваний. Лучшим примером для такого рода баз данных является DisGeNET.[8][25]

База данных ассоциаций генных болезней DisGeNET

DisGeNET
Содержание
ОписаниеОбъединяет ассоциации генов человека с заболеваниями
Типы данных
захвачен
База данных ассоциаций
ОрганизмыЧеловек (Х. Сапиенс)
Контакт
Исследовательский центрПрограмма исследований в области биомедицинской информатики (GRIB) IMIM-UPF
ЛабораторияГруппа интегративной биомедицинской информатики
АвторыФерран Санс и Лаура И. Ферлонг (Пинеро и др., 2015)
Основное цитированиеPMID  25877637
Доступ
Интернет сайтwww.disgenet.org
Разное
Выпуск данных
частота
ежегодный
Версия3

DisGeNET представляет собой обширную базу данных ассоциаций генов и болезней, которая объединяет ассоциации из нескольких источников, охватывающих различные биомедицинские аспекты болезней.[25] В частности, он сосредоточен на современных знаниях о генетических заболеваниях человека, включая менделевские, комплексные и экологические заболевания. Чтобы оценить концепцию модульности болезней человека, эта база данных выполняет систематическое изучение новых свойств сетей человеческих болезней с помощью топологии сети и анализа функциональных аннотаций.[1] Результаты указывают на широко распространенное генетическое происхождение болезней человека и показывают, что для большинства заболеваний, включая менделевские, сложные и экологические, существуют функциональные модули. Более того, обнаружено, что основной набор биологических путей связан с большинством заболеваний человека. Получение аналогичных результатов при обучении кластеры Что касается болезней, результаты этой базы данных позволяют предположить, что связанные заболевания могут возникать из-за дисфункции общих биологических процессов в клетке. Сетевой анализ этой интегрированной базы данных указывает на то, что интеграция данных необходима для получения всеобъемлющего представления о генетическом ландшафте болезней человека и что генетическое происхождение сложных заболеваний встречается гораздо чаще, чем ожидалось.[1]

Онтология ассоциации генов DisGeNET
Описание каждого типа ассоциации в этой онтологии: # Терапевтическая ассоциация: ген / белок играет терапевтическую роль в облегчении заболевания. #Biomarker Association: ген / белок либо играет роль в этиологии заболевания (например, участвует в молекулярном механизме, который приводит к заболеванию), либо является биомаркером заболевания. # Genetic Variation Association: используется, когда вариация последовательности (мутация, SNP) связана с фенотипом заболевания, но все еще нет доказательств того, что вариация вызывает заболевание. В некоторых случаях наличие вариантов увеличивает восприимчивость к болезни. Как правило, предоставляются идентификаторы SNP NCBI. # Измененная ассоциация экспрессии: изменения функции белка посредством измененной экспрессии гена связаны с фенотипом заболевания. • Ассоциация посттрансляционных модификаций: изменения функции белка посредством посттрансляционных модификаций (метилирование или фосфорилирование белка) связаны с фенотипом заболевания. [1]

Некоторые варианты использования

Некоторые из наиболее интересных случаев использования баз данных по генным заболеваниям можно найти в следующих статьях:[1][8]

Замечания о будущем в базах данных по генным болезням

Взаимоотношения при генных заболеваниях

Завершение генома человека изменило способ поиска генов болезней. Раньше подход заключался в том, чтобы сосредоточиться на одном или нескольких генах одновременно. Теперь такие проекты, как DisGeNET, служат примером усилий по систематическому анализу всех генных изменений, связанных с одним или несколькими заболеваниями.[26] Следующим шагом является создание полной картины механистических аспектов болезней и разработка лекарств против них. Для этого потребуется сочетание двух подходов: систематический поиск и углубленное изучение каждого гена. Будущее области будет определяться новыми методами интеграции больших массивов данных из разных источников и включения функциональной информации в анализ крупномасштабных данных, полученных в результате биоинформатических исследований.[1]

Биоинформатика - это и термин, обозначающий совокупность исследований биологических генных заболеваний, в которых компьютерное программирование используется как часть своей методологии, а также ссылка на конкретные аналитические конвейеры, которые используются неоднократно, особенно в областях генетики и геномики.[1] Обычно биоинформатика используется для идентификации генов-кандидатов и нуклеотидов, SNP. Часто такая идентификация проводится с целью лучшего понимания генетической основы болезни, уникальных приспособлений, желаемых свойств или различий между популяциями. Менее формально биоинформатика также пытается понять организационные принципы в последовательностях нуклеиновых кислот и белков.[1]

Реакция биоинформатики на новые экспериментальные методы открывает новую перспективу в анализе экспериментальных данных, о чем свидетельствуют достижения в анализе информации из баз данных о генных заболеваниях и других технологий. Ожидается, что эта тенденция продолжится с использованием новых подходов к ответу на новые методы, такие как технологии секвенирования следующего поколения. Например, наличие большого количества индивидуальных геномов человека будет способствовать развитию компьютерного анализа редких вариантов, включая статистический анализ их отношения к образу жизни, взаимодействию лекарств и другим факторам.[1]Биомедицинские исследования также будут определяться нашей способностью эффективно извлекать большой объем существующих и постоянно генерируемых биомедицинских данных. В частности, методы интеллектуального анализа текста в сочетании с другими молекулярными данными могут предоставить информацию о генных мутациях и взаимодействиях и станут критически важными для того, чтобы опережать экспоненциальный рост данных, генерируемых в биомедицинских исследованиях. Еще одна область, которая извлекает выгоду из достижений в разработке и интеграции молекулярного, клинического и лекарственного анализа, - это фармакогеномика. In silico изучение взаимосвязи между человеческими вариациями и их влиянием на болезни будет ключом к развитию персонализированной медицины.[8]Таким образом, базы данных по генным заболеваниям уже изменили поиск генов болезней и могут стать важным компонентом других областей медицинских исследований.[1]

Смотрите также

Рекомендации

  1. ^ а б c d е ж грамм час я j k л м п А. Бауэр-Мерен, "Анализ сети генов-заболеваний выявляет функциональные модули в Менделевский, Комплексный и экологический болезни, "PLOS One, стр. 1-3, 2011.
  2. ^ а б Ботштейн, Д. (2003). «Обнаружение генотипов, лежащих в основе фенотипов человека: прошлые успехи в лечении Менделирующей болезни, будущие подходы к комплексной болезни». Природа Генетика. 33 (1): 228–237. Дои:10,1038 / нг1090. PMID  12610532.
  3. ^ Рен Дж. Д., Бейтман А. (2008). «Базы данных, данные могилы и пыль на ветру». Биоинформатика. 24 (19): 2127–8. Дои:10.1093 / биоинформатика / btn464. PMID  18819940.
  4. ^ Американская ассоциация медицинской информатики, «Стратегический план Американской ассоциации медицинской информатики», август 2011 г. [Интернет]. Имеется в наличии: http://www.amia.org/inside/stratplan/. [Проверено 15 октября 2014 г.].
  5. ^ Оти, М. (2007). «Модульный характер генетических заболеваний». Клиническая генетика. 71 (1): 1–11. Дои:10.1111 / j.1399-0004.2006.00708.x. PMID  17204041.
  6. ^ Дэвис, А .; Кинг, Б. (2011). «База данных сравнительной токсикогеномики: обновление 2011 г.». Нуклеиновые кислоты Res. 39 (1): 1067–1072. Дои:10.1093 / nar / gkq813. ЧВК  3013756. PMID  20864448.
  7. ^ Дэвис, А .; Вигерс, Т. (2013). "Text Mining эффективно оценивает и ранжирует литературу для улучшения лечения химико-генных заболеваний в базе данных сравнительной токсикогеномики". PLOS One. 8 (4): 1–29. Bibcode:2013PLoSO ... 858201D. Дои:10.1371 / journal.pone.0058201. ЧВК  3629079. PMID  23613709.
  8. ^ а б c d Bauer-Mehren, A .; Рауча, М. (2010). "DisGeNET: плагин Cytoscape для визуализации, интеграции, поиска и анализа сетей генов и болезней". Биоинформатика. 26 (22): 2924–2926. Дои:10.1093 / биоинформатика / btq538. PMID  20861032.
  9. ^ Фогт, И. (2014). «Систематический анализ свойств генов, влияющих на фенотипы систем органов при нарушениях у млекопитающих». Биоинформатика. 30 (21): 3093–3100. Дои:10.1093 / биоинформатика / btu487.
  10. ^ а б Бунеман, П. (2008). «Курируемые базы данных». Библиометрия. 978 (1): 152–162.
  11. ^ а б Мерфи, С .; Дэвис, А. (2009). «База данных сравнительной токсикогеномики: база знаний и инструмент для открытия сетей химик-ген-болезнь». Биоинформатика. 37 (1): 786–792. Дои:10.1093 / нар / gkn580. ЧВК  2686584. PMID  18782832.
  12. ^ «Универсальный протеиновый ресурс (UniProt)». Исследования нуклеиновых кислот. 36 (1): 190–195. 2008. Дои:10.1093 / нар / гкм895. ЧВК  1669721. PMID  18045787.
  13. ^ Унипрот, К. (2010). «Текущие и будущие разработки Universal Protein Resource». Исследования нуклеиновых кислот. 39 (Проблема с базой данных): D214 – D219. Дои:10.1093 / nar / gkq1020. ЧВК  3013648. PMID  21051339.
  14. ^ К. Браун, "База данных прогнозируемых взаимодействий между людьми", Биоинформатика, т. 21, нет. 9. С. 2076-2082, 2005.
  15. ^ С. Хантер и П. Джонс, «InterPro в 2011 году: новые разработки в базе данных прогнозирования семей и доменов», Исследования нуклеиновых кислот, т. 10, вып. 1. С. 12-22, 2011.
  16. ^ К. Булт и Дж. Эппиг, "База данных генома мышей (MGD): биология мыши и модельные системы", Исследования нуклеиновых кислот, т. 36, нет. 1. С. 724-728, 2007.
  17. ^ а б М. Двинелл, Э. Уорти и С. М. "База данных генома крысы 2009: вариации, онтологии и пути", Исследования нуклеиновых кислот, т. 37, нет. 1. С. 744-749, 2009.
  18. ^ Симояма М., Де Понс Дж., Хейман Г.Т. и др. (2015). «База данных генома крысы 2015: геномные, фенотипические и экологические вариации и болезни». Исследования нуклеиновых кислот. 43 (Выпуск базы данных): D743–50. Дои:10.1093 / нар / gku1026. ЧВК  4383884. PMID  25355511.
  19. ^ а б А. Хомош, «Онлайн-Менделирующая наследование в человеке (OMIM), база знаний о генах человека и генетических нарушениях», Исследования нуклеиновых кислот, т. 33, нет. 1. С. 514-517, 2005.
  20. ^ Хаббард Т. и др. (Январь 2002 г.). «Проект базы данных генома Ensembl». Исследования нуклеиновых кислот. 30 (1): 38–41. Дои:10.1093 / nar / 30.1.38. ЧВК  99161. PMID  11752248. Получено 11 ноября 2014.
  21. ^ а б П. Фличек и М. Ридван, "Ensembl 2012" Исследования нуклеиновых кислот, т. 40, нет. 1. С. 84-90, 2012.
  22. ^ Беккер, К .; Барнс, К. (2004). «База данных генетических ассоциаций». Природа Генетика. 36 (5): 431–432. Дои:10.1038 / ng0504-431. PMID  15118671.
  23. ^ https://geneticassociationdb.nih.gov/
  24. ^ Браво, А; и другие. (2014). «Извлечение связей между генами и заболеваниями из текста и крупномасштабного анализа данных: значение для трансляционных исследований». BMC Bioinformatics. 16 (1): 55. Дои:10.1186 / s12859-015-0472-9. ЧВК  4466840. PMID  25886734.
  25. ^ а б Пиньеро; и другие. (2015). «DisGeNET: платформа для динамических исследований болезней человека и их генов». База данных. 2015: bav028. Дои:10.1093 / база данных / bav028. ЧВК  4397996. PMID  25877637.
  26. ^ Оти, М. (2006). «Прогнозирование генов болезней с помощью белок-белковых взаимодействий». J. Med. Genet. 43 (8): 691–698. Дои:10.1136 / jmg.2006.041376. ЧВК  2564594. PMID  16611749.