Список биологических баз данных - List of biological databases
Биологические базы данных являются хранилищами биологической информации.[1] Журнал Исследования нуклеиновых кислот регулярно публикует специальные выпуски по биологическим базам данных и имеет список таких баз данных. В выпуске 2018 года есть список из около 180 таких баз и обновлений к ранее описанным базам.[2]
Мета базы данных
Мета-базы данных - это базы данных, которые собирают данные о данных для создания новых данных. Они способны объединять информацию из разных источников и делать ее доступной в новой и более удобной форме или с акцентом на конкретное заболевание или организм.
- ConsensusPathDB: база данных молекулярно-функционального взаимодействия, объединяющая информацию из 12 других
- Entrez (Национальный центр биотехнологической информации )
- Информационная структура по неврологии (Калифорнийский университет в Сан-Диего ): объединяет сотни ресурсов, имеющих отношение к нейробиологии; многие из них перечислены ниже
Базы данных модельных организмов
Базы данных модельных организмов предоставить подробные биологические данные для интенсивного изучения.
- PomBase: база знаний о делящихся дрожжах Schizosaccharomyces pombe[3]
Базы данных нуклеиновых кислот
Базы данных ДНК
Первичные базы данных
Международная база данных нуклеотидных последовательностей (INSD) состоит из следующих баз данных.
- Банк данных ДНК Японии (Национальный институт генетики )
- EMBL (Европейский институт биоинформатики )
- GenBank (Национальный центр биотехнологической информации )
DDBJ (Япония), GenBank (США) и European Nucleotide Archive (Европа) являются хранилищами нуклеотидов. последовательность данные со всех организмы. Все три принимают представления нуклеотидных последовательностей, а затем ежедневно обмениваются новыми и обновленными данными для достижения оптимальной синхронизации между ними. Эти три базы данных являются первичными, поскольку в них хранятся исходные данные о последовательностях. Они сотрудничают с Последовательность чтения из архива (SRA), который архивирует необработанные чтения с высокопроизводительных инструментов секвенирования.
Вторичные базы данных
- 23andMe база данных
- HapMap
- OMIM (Онлайн-менделевское наследование в человеке): наследственные болезни
- RefSeq
- Проект 1000 геномов: запущен в январе 2008 года. Были проанализированы и опубликованы геномы более тысячи анонимных участников из ряда различных этнических групп.
- База данных EggNOG: Иерархический, функционально и филогенетически аннотированный ресурс по ортологии на основе 5090 организмов и 2502 вирусов. Он обеспечивает множественные выравнивания последовательностей и деревья максимального правдоподобия, а также широкую функциональную аннотацию.[4][5]
Базы данных экспрессии генов (в основном данные микрочипов)
Базы данных генома
Эти базы данных собирают геном последовательности, аннотировать и анализировать их, а также предоставить общий доступ. Некоторые добавляют курирование экспериментальной литературы для улучшения компьютерных аннотаций. Эти базы данных могут содержать геномы многих видов или один модельный организм геном.
- ArrayExpress:[6] архив данных функциональной геномики; хранит данные высокопроизводительных экспериментов по функциональной геномике из EMBL
- Биоинформатический комбайн
- Ансамбль: обеспечивает автоматические базы данных аннотаций для людей, мыши и других позвоночное животное и эукариот геномы
- Ансамблевые геномы: предоставляет данные в масштабе генома для бактерий, простейших, грибов, растений и беспозвоночных многоклеточных через унифицированный набор интерактивных и программных интерфейсов (с использованием программной платформы Ensembl)
- FlyBase: геном модельный организм Drosophila melanogaster
- База данных генных болезней
- Омнибус экспрессии генов (GEO[7]): общедоступный репозиторий функциональных геномных данных из США. Национальный институт рака (NCI), который поддерживает данные на основе массивов и последовательностей. Предоставляются инструменты для запроса и загрузки профилей экспрессии генов.
- Атлас белков человека (HPA[8]): общедоступная база данных с профилями экспрессии генов, кодирующих человеческие белки, на уровне мРНК и белка в тканях, клетках, субклеточных компартментах и раковых опухолях.
- Информационная система по бобовым (LIS): геномная база данных для семейства бобовых[9]
- Персональный проект генома: человеческие геномы 100 000 добровольцев со всего мира
- RGD (База данных генома крысы ): геномные и фенотипические данные для Rattus norvegicus
- База данных генома Saccharomyces:[10] геном дрожжи модельный организм
- SNPedia
- База данных SoyBase[11] (SoyBase): генетика и геномная база данных сои Министерства сельского хозяйства США (Соя )
- Браузер генома малярии UCSC: геном видов, вызывающих малярию (Плазмодий falciparum и другие)
- Червячная база: геном модельный организм Caenorhabditis elegans и WormBase ParaSite для паразитических видов
- Xenbase: геном модельный организм Xenopus tropicalis и Xenopus laevis
- Информационная сеть по рыбкам данио: геном этого рыбы модельный организм
Базы данных фенотипов
- PHI-база: база данных взаимодействия патоген-хозяин. Он связывает информацию о генах с фенотипической информацией от микробных патогенов на их хозяевах. Информация подбирается вручную из рецензируемой литературы.
- RGD База данных генома крысы: данные генома и фенотипа для Раттус норвегикус
- PomBase база данных: собранные вручную фенотипические данные для дрожжей Schizosaccharomyces pombe
РНК базы данных
Базы данных аминокислот / белков
Белковая последовательность базы данных
- DisProt: база данных экспериментальных доказательств нарушения в белках (Медицинский факультет Университета Индианы, Темпл университет, Университет Падуи )
- ИнтерПро: классифицирует белки по семействам и предсказывает наличие доменов и сайтов
- MobiDB: аннотация базы данных нарушений внутреннего белка (Университет Падуи )
- neXtProt: ресурс знаний, ориентированный на человеческий белок
- Pfam: база данных выравниваний семейств белков и HMM (Институт Сэнгера )
- ПЕЧАТИ: сборник белковых отпечатков пальцев из (Манчестерский университет )
- PROSITE: база данных белковые семейства и домены
- Информационный ресурс о белках (Джорджтаунский университет Медицинский центр [ГУМЦ])
- СУПЕРСЕМЬЯ: библиотека HMM, представляющих суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов
- Swiss-Prot: база знаний о белках (Швейцарский институт биоинформатики )
- NCBI: последовательность белков и база знаний (Национальный центр биотехнологической информации)
Белковая структура базы данных
- Банк данных белков (PDB), включающий:
- Структурная классификация белков (SCOP)
Дополнительные базы данных структуры белков см. Также База данных структуры белков.
Белковая модель базы данных
- ModBase: база данных сравнительных моделей структуры белков (Сали Лаборатория, UCSF )
- Матрица подобия белков (SIMAP ): база данных сходства белков, рассчитанная с использованием ФАСТА
- Швейцарская модель: сервер и репозиторий для моделей структуры белков
- AAindex: база данных аминокислотных индексов, матриц аминокислотных мутаций и потенциалов парных контактов
Белок-протеин и другие молекулярные взаимодействия
- BioGRID: общий репозиторий для наборов данных взаимодействия (Исследовательский институт Самуэля Луненфельда )
- База данных РНК-связывающих белков
- База данных взаимодействующих белков (Univ. Калифорнии )
- Нетронутый:[15][16] база данных с открытым исходным кодом для молекулярных взаимодействий (EMBL-EBI )
Экспрессия белка базы данных
- Атлас белков человека: нацелен на отображение всех белков человека в клетках, тканях и органах.
Базы данных путей передачи сигналов
- База данных взаимодействия NCI-Nature Pathway
- Netpath: кураторский ресурс пути передачи сигналов в людях
- Reactome: навигационная карта биологических путей человека, от метаболических процессов до гормональных сигналов (Институт Онтарио по исследованию рака, Европейский институт биоинформатики, Медицинский центр NYU Langone, Лаборатория Колд-Спринг-Харбор )
- WikiPathways
Базы данных метаболических путей и функций белков
- Коллекция базы данных BioCyc: включает EcoCyc и MetaCyc
- БРЕНДА: комплексная информационная система по ферментам, включая FRENDA, AMENDA, DRENDA и KENDA
- HMDB: содержит подробную информацию о низкомолекулярных метаболитах, обнаруженных в организме человека.
- База данных KEGG PATHWAY (Univ. Киото )
- База данных MANET (Университет Иллинойса )
- Reactome: навигационная карта биологических путей человека, начиная от метаболический процессы гормональной сигнализации (Институт Онтарио по исследованию рака, Европейский институт биоинформатики, Медицинский центр NYU Langone, Лаборатория Колд-Спринг-Харбор )
- САБИО-РК: база данных биохимических реакций и их кинетических свойств
- WikiPathways
Дополнительные базы данных
Экзосомные базы данных
- ExoCarta
- Атлас внеклеточной РНК: хранилище профилей малых РНК-seq и qPCR exRNA из биологических жидкостей человека и мыши
Базы данных математических моделей
- База данных биомоделей: опубликованы математические модели, описывающие биологические процессы
Таксономические базы данных
- BacDive: бактериальная база метаданных, которая предоставляет связанную с штаммом информацию о бактериальном и архейном биоразнообразии, включая информацию о таксономии.
- EzTaxon-e: база данных для идентификации прокариот на основе последовательностей гена 16S рибосомной РНК
Радиологические базы данных
- Архив изображений рака (TCIA)
- Информационный центр инструментов и ресурсов для нейровизуализации и информатики
Устойчивость к противомикробным препаратам базы данных
- AMRFinderPlus
- База данных антимикробных препаратов (AMDD)
- ARDB
- ARGminer
- BacMet
- База данных бета-лактамаз (BLAD)
- База данных бета-лактамаз (BLDB)
- CBMAR
- Полная база данных по устойчивости к антибиотикам
- EARS-Net
- ФЕРМА
- ИНТЕГРАЛ
- ЛАКЕД
- МЕГАРЫ
- MUBII-TB-DB
- База данных горчицы
- MvirDB
- PathoPhenoDB
- База данных PATRIC
- RAC: Репозиторий кассет устойчивости к антибиотикам
- ResFinder
- TBDReaMDB
- u-CARE
- VFDB
Базы данных в стиле вики
Специализированные базы данных
- Штрих-код систем жизненных данных: база данных Штрих-коды ДНК
- Атлас генома рака (TCGA): предоставляет данные из сотен образцов рака, полученных с использованием высокопроизводительных методов, таких как профилирование экспрессии генов, профилирование вариации числа копий, генотипирование SNP, профилирование метилирования ДНК по всему геному, профилирование микроРНК и секвенирование экзонов не менее 1200 генов.
- Целлозавр: ресурс знаний о клеточных линиях
- CTD (База данных сравнительной токсикогеномики ): описывает химические взаимодействия генов и болезней
- DiProDB: база данных для сбора и анализа термодинамических, структурных и других свойств динуклеотидов
- Атлас служебных и справочных документов (Атлас HRT) [17]веб-инструмент для поиска референсных генов / транскриптов кандидатов, специфичных для клеток, подходящих для нормализации эксперимента qPCR. HRT Atlas также описывает полный список генов и транскриптов домашнего хозяйства человека и мыши.
- Дриада: репозиторий данных, лежащих в основе научных публикаций в фундаментальных и прикладных биологических науках.
- Эдинбургский Атлас Мышей
- База данных эукариотических промоторов EPD
- FINDbase (база данных Частота наследственных заболеваний)
- GigaDB: хранилище крупномасштабных наборов данных, лежащих в основе научных публикаций в области биологических и биомедицинских исследований.
- HGNC (Комитет по номенклатуре генов HUGO): ресурс для утвержденной номенклатуры генов человека
- Международный консорциум эпигенома человека:[18] объединяет эпигеномные справочные данные из известных национальных проектов, таких как Канадский CEEHRC,[19] Европейский чертеж,[20] Европейский архив генома-фенома (EGA[21]), НАС КОДИРОВАТЬ и NIH Дорожная карта, Немецкий DEEP,[22] Японский ГЕРБ,[23] Корейский KNIH, Сингапурская ГИС и Китайская EpiHK[24]
- MethBase: база данных Метилирование ДНК данные визуализируются на Браузер генома UCSC
- Minimotif Майнер: база данных коротких смежных функциональных пептидных мотивов
- Онкогеномные базы данных: сборник баз данных, служащих для исследования рака
- PubMed: справочные материалы и рефераты по медико-биологическим и биомедицинским вопросам.
- RIKEN интегрированная база данных по млекопитающим
- Цели TDR: база данных по хемогеномике, посвященная открытию лекарств от тропических болезней
- ТРАНСФАК: база данных о факторах транскрипции эукариот, их сайтах связывания генома и профилях связывания ДНК
- ДЖАСПАР: база данных вручную созданных неизбыточных профилей связывания факторов транскрипции.
- MetOSite: база данных о сайтах сульфоксидации метионина и его функциональной роли в белках[25]
- Проект затрат и использования здравоохранения (HCUP) - это крупнейший сборник данных о больничной помощи в США. Он включает сотни миллионов записей в стационарных, амбулаторных и неотложных случаях.
Рекомендации
- ^ Рен Дж. Д., Бейтман А. (октябрь 2008 г.). «Базы данных, данные могилы и пыль на ветру». Биоинформатика. 24 (19): 2127–8. Дои:10.1093 / биоинформатика / btn464. PMID 18819940.
- ^ "Том 46, выпуск D1 | Исследование нуклеиновых кислот | Oxford Academic". Acade.oup.com. Получено 2018-09-04.
- ^ Замок, А; Резерфорд, К; Харрис, Массачусетс; Hayles, J; Оливер SG; Bähler, J; Вуд, V (13 октября 2018 г.). «PomBase 2018: управляемая пользователем повторная реализация базы данных по делящимся дрожжам обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации». Исследования нуклеиновых кислот. 47 (D1): D821 – D827. Дои:10.1093 / нар / gky961. ЧВК 6324063. PMID 30321395.
- ^ Пауэлл, Шон; Форслунд, Кристоффер; Шкларчик, Дамиан; Трачана, Каллиопи; Рот, Александр; Уэрта-Сепас, Хайме; Габальдон, Тони; Раттей, Томас; Криви, Крис; Кун, Майкл; Дженсен, Ларс Дж. (01.12.2013). "eggNOG v4.0: вывод вложенной ортологии для 3686 организмов". Исследования нуклеиновых кислот. 42 (D1): D231 – D239. Дои:10.1093 / нар / gkt1253. ISSN 0305-1048. ЧВК 3964997. PMID 24297252.
- ^ Уэрта-Сепас, Хайме; Шкларчик, Дамиан; Хеллер, Давиде; Эрнандес-Плаза, Ана; Форслунд, София К; Повар, Хелен; Mende, Daniel R; Летунич, Ивица; Раттей, Томас; Дженсен, Ларс Дж; фон Меринг, Кристиан (2018-11-12). "eggNOG 5.0: иерархический, функционально и филогенетически аннотированный ресурс по ортологии на основе 5090 организмов и 2502 вирусов". Исследования нуклеиновых кислот. 47 (D1): D309 – D314. Дои:10.1093 / нар / gky1085. ISSN 0305-1048. ЧВК 6324079. PMID 30418610.
- ^ ArrayExpress
- ^ GEO
- ^ "Атлас человеческого белка". www.proteinatlas.org. Получено 2019-05-27.
- ^ Дэш С., Кэмпбелл Д. Д., Кэннон Е. К., Клири А. М., Хуанг В., Калберер С. Р., Карингула В., Райс А. Г., Сингх Дж., Умале П. Е., Weeks NT, Уилки А. П., Фермер А. Д., Кэннон С. Б. (январь 2016 г.). «Информационная система по бобовым (LegumeInfo.org): ключевой компонент набора объединенных ресурсов данных для семейства бобовых». Исследования нуклеиновых кислот. 44 (D1): D1181-8. Дои:10.1093 / нар / gkv1159. ЧВК 4702835. PMID 26546515.
- ^ "База данных генома сахаромицетов | SGD". www.yeastgenome.org. Получено 2018-09-04.
- ^ Грант, Дэвид; Нельсон, Рекс Т .; Кэннон, Стивен Б.; Шумейкер, Рэнди С. (2010). «SoyBase, база данных по генетике и геномике сои USDA-ARS». Исследования нуклеиновых кислот. 38 (Дополнение 1) (Выпуск базы данных): D843 – D846. Дои:10.1093 / нар / gkp798. ЧВК 2808871. PMID 20008513.
- ^ Мир С., Алхруб Ю., Аньянго С., Армстронг Д. Р., Беррисфорд Дж. М., Кларк А. Р., Конрой М. Дж., Дана Дж. М., Дешпанде М., Гупта Д., Гутманас А., Хаслам П., Мак Л., Мухопадхьяй А., Надзирин Н., Пайсан-Лафосс Т., Sehnal D, Sen S, Smart OS, Varadi M, Kleywegt GJ, Velankar S (январь 2018 г.). «PDBe: к многоразовой инфраструктуре доставки данных в банке данных белков в Европе». Исследования нуклеиновых кислот. 46 (D1): D486 – D492. Дои:10.1093 / нар / gkx1070. ЧВК 5753225. PMID 29126160.
- ^ Kinjo AR, Bekker GJ, Suzuki H, Tsuchiya Y, Kawabata T, Ikegawa Y, Nakamura H (январь 2017 г.). «Protein Data Bank Japan (PDBj): обновленные пользовательские интерфейсы, структура описания ресурсов, инструменты анализа для больших структур». Исследования нуклеиновых кислот. 45 (D1): D282 – D288. Дои:10.1093 / нар / gkw962. ЧВК 5210648. PMID 27789697.
- ^ Rose PW, Prlić A, Altunkaya A, Bi C, Bradley AR, Christie CH и др. (Январь 2017 г.). «Банк данных о белках RCSB: комплексное представление о белках, генах и трехмерной структурной информации». Исследования нуклеиновых кислот. 45 (D1): D271 – D281. Дои:10.1093 / нар / gkw1000. ЧВК 5210513. PMID 27794042.
- ^ Hermjakob, H., Montecchi-Palazzi, L., Lewington, C., Mudali, S., Kerrien, S., Orchard, S., Vingron, M., Roechert, B., Roepstorff, P., Valencia, A ., Маргалит, Х., Армстронг, Дж., Байрох, А., Чезарени, Г., Шерман, Д., и Апвейлер, Р. (2004). IntAct: база данных молекулярных взаимодействий с открытым исходным кодом. Исследование нуклеиновых кислот, 32 (выпуск базы данных), D452 – D455. https://doi.org/10.1093/nar/gkh052
- ^ Керриен, С., Аранда, Б., Бреуза, Л., Бридж, А., Брукс-Картер, Ф., Чен, К., Дуэсбери, М., Дюмуссо, М., Фейерман, М., Хинц, У. ., Jandrasits, C., Jimenez, RC, Khadake, J., Mahadevan, U., Masson, P., Pedruzzi, I., Pfeiffenberger, E., Porras, P., Raghunath, A., Roechert, B. ,… Hermjakob, H. (2012). База данных по взаимодействию молекул IntAct в 2012 году. Исследование нуклеиновых кислот, 40 (выпуск базы данных), D841 – D846. https://doi.org/10.1093/nar/gkr1088
- ^ Хункпе, Бидоссесси Вильфрид; Чену, Франсин; де-Лима, Франсьель; Де-Паула, Эрих Винисиус (14.07.2020). «База данных HRT Atlas v1.0: новое определение генов домашнего хозяйства человека и мыши и возможных эталонных транскриптов путем анализа массивных наборов данных RNA-seq». Исследования нуклеиновых кислот: gkaa609. Дои:10.1093 / нар / gkaa609. ISSN 0305-1048. PMID 32663312.
- ^ (IHEC) портал данных
- ^ CEEHRC
- ^ Чертеж
- ^ EGA
- ^ ГЛУБОКИЙ
- ^ КРЕСТ
- ^ «Глобальный обмен эпигеномами». Методы природы. 15 (3): 151. 2018. Дои:10.1038 / nmeth.4630. ISSN 1548-7105.
- ^ Вальверде, Эктор; Cantón, Francisco R .; Аледо, Хуан Карлос (2019). «Метосайт: комплексный ресурс для изучения сульфоксидации остатков метионина». Биоинформатика. 35 (22): 4849–4850. Дои:10.1093 / биоинформатика / btz462. ЧВК 6853639. PMID 31197322.
внешняя ссылка
- Коллекция базы данных молекулярной биологии исследования нуклеиновых кислот - более 1600 баз данных