Список биологических баз данных - List of biological databases

Биологические базы данных являются хранилищами биологической информации.[1] Журнал Исследования нуклеиновых кислот регулярно публикует специальные выпуски по биологическим базам данных и имеет список таких баз данных. В выпуске 2018 года есть список из около 180 таких баз и обновлений к ранее описанным базам.[2]

Мета базы данных

Мета-базы данных - это базы данных, которые собирают данные о данных для создания новых данных. Они способны объединять информацию из разных источников и делать ее доступной в новой и более удобной форме или с акцентом на конкретное заболевание или организм.

Базы данных модельных организмов

Базы данных модельных организмов предоставить подробные биологические данные для интенсивного изучения.

Базы данных нуклеиновых кислот

Базы данных ДНК

Первичные базы данных
Международная база данных нуклеотидных последовательностей (INSD) состоит из следующих баз данных.

DDBJ (Япония), GenBank (США) и European Nucleotide Archive (Европа) являются хранилищами нуклеотидов. последовательность данные со всех организмы. Все три принимают представления нуклеотидных последовательностей, а затем ежедневно обмениваются новыми и обновленными данными для достижения оптимальной синхронизации между ними. Эти три базы данных являются первичными, поскольку в них хранятся исходные данные о последовательностях. Они сотрудничают с Последовательность чтения из архива (SRA), который архивирует необработанные чтения с высокопроизводительных инструментов секвенирования.

Вторичные базы данных

  • 23andMe база данных
  • HapMap
  • OMIM (Онлайн-менделевское наследование в человеке): наследственные болезни
  • RefSeq
  • Проект 1000 геномов: запущен в январе 2008 года. Были проанализированы и опубликованы геномы более тысячи анонимных участников из ряда различных этнических групп.
  • База данных EggNOG: Иерархический, функционально и филогенетически аннотированный ресурс по ортологии на основе 5090 организмов и 2502 вирусов. Он обеспечивает множественные выравнивания последовательностей и деревья максимального правдоподобия, а также широкую функциональную аннотацию.[4][5]

Базы данных экспрессии генов (в основном данные микрочипов)

Базы данных генома

Эти базы данных собирают геном последовательности, аннотировать и анализировать их, а также предоставить общий доступ. Некоторые добавляют курирование экспериментальной литературы для улучшения компьютерных аннотаций. Эти базы данных могут содержать геномы многих видов или один модельный организм геном.

Базы данных фенотипов

  • PHI-база: база данных взаимодействия патоген-хозяин. Он связывает информацию о генах с фенотипической информацией от микробных патогенов на их хозяевах. Информация подбирается вручную из рецензируемой литературы.
  • RGD База данных генома крысы: данные генома и фенотипа для Раттус норвегикус
  • PomBase база данных: собранные вручную фенотипические данные для дрожжей Schizosaccharomyces pombe

РНК базы данных

Базы данных аминокислот / белков

Белковая последовательность базы данных

Белковая структура базы данных

Дополнительные базы данных структуры белков см. Также База данных структуры белков.

Белковая модель базы данных

  • ModBase: база данных сравнительных моделей структуры белков (Сали Лаборатория, UCSF )
  • Матрица подобия белков (SIMAP ): база данных сходства белков, рассчитанная с использованием ФАСТА
  • Швейцарская модель: сервер и репозиторий для моделей структуры белков
  • AAindex: база данных аминокислотных индексов, матриц аминокислотных мутаций и потенциалов парных контактов

Белок-протеин и другие молекулярные взаимодействия

Экспрессия белка базы данных

Базы данных путей передачи сигналов

Базы данных метаболических путей и функций белков

Дополнительные базы данных

Экзосомные базы данных

  • ExoCarta
  • Атлас внеклеточной РНК: хранилище профилей малых РНК-seq и qPCR exRNA из биологических жидкостей человека и мыши

Базы данных математических моделей

Таксономические базы данных

  • BacDive: бактериальная база метаданных, которая предоставляет связанную с штаммом информацию о бактериальном и архейном биоразнообразии, включая информацию о таксономии.
  • EzTaxon-e: база данных для идентификации прокариот на основе последовательностей гена 16S рибосомной РНК

Радиологические базы данных

Устойчивость к противомикробным препаратам базы данных

Базы данных в стиле вики

Специализированные базы данных

Рекомендации

  1. ^ Рен Дж. Д., Бейтман А. (октябрь 2008 г.). «Базы данных, данные могилы и пыль на ветру». Биоинформатика. 24 (19): 2127–8. Дои:10.1093 / биоинформатика / btn464. PMID  18819940.
  2. ^ "Том 46, выпуск D1 | Исследование нуклеиновых кислот | Oxford Academic". Acade.oup.com. Получено 2018-09-04.
  3. ^ Замок, А; Резерфорд, К; Харрис, Массачусетс; Hayles, J; Оливер SG; Bähler, J; Вуд, V (13 октября 2018 г.). «PomBase 2018: управляемая пользователем повторная реализация базы данных по делящимся дрожжам обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации». Исследования нуклеиновых кислот. 47 (D1): D821 – D827. Дои:10.1093 / нар / gky961. ЧВК  6324063. PMID  30321395.
  4. ^ Пауэлл, Шон; Форслунд, Кристоффер; Шкларчик, Дамиан; Трачана, Каллиопи; Рот, Александр; Уэрта-Сепас, Хайме; Габальдон, Тони; Раттей, Томас; Криви, Крис; Кун, Майкл; Дженсен, Ларс Дж. (01.12.2013). "eggNOG v4.0: вывод вложенной ортологии для 3686 организмов". Исследования нуклеиновых кислот. 42 (D1): D231 – D239. Дои:10.1093 / нар / gkt1253. ISSN  0305-1048. ЧВК  3964997. PMID  24297252.
  5. ^ Уэрта-Сепас, Хайме; Шкларчик, Дамиан; Хеллер, Давиде; Эрнандес-Плаза, Ана; Форслунд, София К; Повар, Хелен; Mende, Daniel R; Летунич, Ивица; Раттей, Томас; Дженсен, Ларс Дж; фон Меринг, Кристиан (2018-11-12). "eggNOG 5.0: иерархический, функционально и филогенетически аннотированный ресурс по ортологии на основе 5090 организмов и 2502 вирусов". Исследования нуклеиновых кислот. 47 (D1): D309 – D314. Дои:10.1093 / нар / gky1085. ISSN  0305-1048. ЧВК  6324079. PMID  30418610.
  6. ^ ArrayExpress
  7. ^ GEO
  8. ^ "Атлас человеческого белка". www.proteinatlas.org. Получено 2019-05-27.
  9. ^ Дэш С., Кэмпбелл Д. Д., Кэннон Е. К., Клири А. М., Хуанг В., Калберер С. Р., Карингула В., Райс А. Г., Сингх Дж., Умале П. Е., Weeks NT, Уилки А. П., Фермер А. Д., Кэннон С. Б. (январь 2016 г.). «Информационная система по бобовым (LegumeInfo.org): ключевой компонент набора объединенных ресурсов данных для семейства бобовых». Исследования нуклеиновых кислот. 44 (D1): D1181-8. Дои:10.1093 / нар / gkv1159. ЧВК  4702835. PMID  26546515.
  10. ^ "База данных генома сахаромицетов | SGD". www.yeastgenome.org. Получено 2018-09-04.
  11. ^ Грант, Дэвид; Нельсон, Рекс Т .; Кэннон, Стивен Б.; Шумейкер, Рэнди С. (2010). «SoyBase, база данных по генетике и геномике сои USDA-ARS». Исследования нуклеиновых кислот. 38 (Дополнение 1) (Выпуск базы данных): D843 – D846. Дои:10.1093 / нар / gkp798. ЧВК  2808871. PMID  20008513.
  12. ^ Мир С., Алхруб Ю., Аньянго С., Армстронг Д. Р., Беррисфорд Дж. М., Кларк А. Р., Конрой М. Дж., Дана Дж. М., Дешпанде М., Гупта Д., Гутманас А., Хаслам П., Мак Л., Мухопадхьяй А., Надзирин Н., Пайсан-Лафосс Т., Sehnal D, Sen S, Smart OS, Varadi M, Kleywegt GJ, Velankar S (январь 2018 г.). «PDBe: к многоразовой инфраструктуре доставки данных в банке данных белков в Европе». Исследования нуклеиновых кислот. 46 (D1): D486 – D492. Дои:10.1093 / нар / gkx1070. ЧВК  5753225. PMID  29126160.
  13. ^ Kinjo AR, Bekker GJ, Suzuki H, Tsuchiya Y, Kawabata T, Ikegawa Y, Nakamura H (январь 2017 г.). «Protein Data Bank Japan (PDBj): обновленные пользовательские интерфейсы, структура описания ресурсов, инструменты анализа для больших структур». Исследования нуклеиновых кислот. 45 (D1): D282 – D288. Дои:10.1093 / нар / gkw962. ЧВК  5210648. PMID  27789697.
  14. ^ Rose PW, Prlić A, Altunkaya A, Bi C, Bradley AR, Christie CH и др. (Январь 2017 г.). «Банк данных о белках RCSB: комплексное представление о белках, генах и трехмерной структурной информации». Исследования нуклеиновых кислот. 45 (D1): D271 – D281. Дои:10.1093 / нар / gkw1000. ЧВК  5210513. PMID  27794042.
  15. ^ Hermjakob, H., Montecchi-Palazzi, L., Lewington, C., Mudali, S., Kerrien, S., Orchard, S., Vingron, M., Roechert, B., Roepstorff, P., Valencia, A ., Маргалит, Х., Армстронг, Дж., Байрох, А., Чезарени, Г., Шерман, Д., и Апвейлер, Р. (2004). IntAct: база данных молекулярных взаимодействий с открытым исходным кодом. Исследование нуклеиновых кислот, 32 (выпуск базы данных), D452 – D455. https://doi.org/10.1093/nar/gkh052
  16. ^ Керриен, С., Аранда, Б., Бреуза, Л., Бридж, А., Брукс-Картер, Ф., Чен, К., Дуэсбери, М., Дюмуссо, М., Фейерман, М., Хинц, У. ., Jandrasits, C., Jimenez, RC, Khadake, J., Mahadevan, U., Masson, P., Pedruzzi, I., Pfeiffenberger, E., Porras, P., Raghunath, A., Roechert, B. ,… Hermjakob, H. (2012). База данных по взаимодействию молекул IntAct в 2012 году. Исследование нуклеиновых кислот, 40 (выпуск базы данных), D841 – D846. https://doi.org/10.1093/nar/gkr1088
  17. ^ Хункпе, Бидоссесси Вильфрид; Чену, Франсин; де-Лима, Франсьель; Де-Паула, Эрих Винисиус (14.07.2020). «База данных HRT Atlas v1.0: новое определение генов домашнего хозяйства человека и мыши и возможных эталонных транскриптов путем анализа массивных наборов данных RNA-seq». Исследования нуклеиновых кислот: gkaa609. Дои:10.1093 / нар / gkaa609. ISSN  0305-1048. PMID  32663312.
  18. ^ (IHEC) портал данных
  19. ^ CEEHRC
  20. ^ Чертеж
  21. ^ EGA
  22. ^ ГЛУБОКИЙ
  23. ^ КРЕСТ
  24. ^ «Глобальный обмен эпигеномами». Методы природы. 15 (3): 151. 2018. Дои:10.1038 / nmeth.4630. ISSN  1548-7105.
  25. ^ Вальверде, Эктор; Cantón, Francisco R .; Аледо, Хуан Карлос (2019). «Метосайт: комплексный ресурс для изучения сульфоксидации остатков метионина». Биоинформатика. 35 (22): 4849–4850. Дои:10.1093 / биоинформатика / btz462. ЧВК  6853639. PMID  31197322.

внешняя ссылка