База данных универсальных модельных организмов - Generic Model Organism Database
В База данных универсальных модельных организмов (GMOD) предоставляет биологическим исследовательским сообществам инструментарий программное обеспечение с открытым исходным кодом компоненты для визуализации, аннотирования, управления и хранения биологических данных. Проект GMOD финансируется США. Национальные институты здоровья, Национальный фонд науки и Служба сельскохозяйственных исследований Министерства сельского хозяйства США.
История
Проект GMOD был начат в начале 2000-х годов как сотрудничество нескольких базы данных моделей организмов (МОДЫ) кто разделял потребность создавать похожие программного обеспечения инструменты для обработки данных из проектов секвенирования. MOD, или специфичные для организма базы данных, описывать геном и другая информация о важных экспериментальные организмы в науках о жизни и охватить большие объемы данных и информации, генерируемые современными биология. Вместо того, чтобы каждая группа разрабатывала собственное программное обеспечение, четыре основных мода:FlyBase, База данных генома Saccharomyces, База данных генома мышей, и WormBase - работали вместе для создания приложений, которые обеспечивают функциональность, необходимую для всех модов, например, программное обеспечение, помогающее управлять данными в моде, а также помогать пользователям получать доступ к данным и запрашивать их.
Проект GMOD направлен на обеспечение взаимодействия программных компонентов. С этой целью многие инструменты используют общий формат файла ввода / вывода или запускаются из базы данных схемы Chado.
Схема базы данных Chado
Чадо[1] Схема направлена на охват многих классов данных, часто используемых современными биологами, от генетических данных до филогенетических деревьев, публикаций и организмов, данных микрочипов, идентификаторов и экспрессии РНК / белков. Чадо широко использует контролируемые словари для ввода всех сущностей в базе данных; например: гены, транскрипты, экзоны, мобильные элементы и т. д. хранятся в таблице функций с типом, предоставленным Онтология последовательности. Когда новый тип добавляется в онтологию последовательности, таблица функций не требует модификации, только обновление данных в базе данных. То же самое можно сказать и о данных анализа, которые также можно хранить в Chado.
Существующие основные модули Чадо:
- последовательность - для последовательностей / функций
- cv - для контролируемых словарей / онтологий
- общие - в настоящее время просто dbxrefs
- организм - таксономические данные
- pub - публикации и ссылки
- companalysis - дополняет модуль последовательности данными вычислительного анализа
- map - карты непоследовательности
- генетико-генетические и фенотипические данные
- выражение - экспрессия гена
- естественное разнообразие - данные о населении
Программного обеспечения
Полный список компонентов программного обеспечения GMOD находится на странице компонентов GMOD. Эти компоненты включают:
|
Участвующие базы данных
Следующие ниже базы данных организмов вносят свой вклад и / или принимают компоненты GMOD для баз данных модельных организмов.
АНИСИД | АнтоноспораДБ | Арабидопсис |
Beebase | BeetleBase[4] | База данных генома крупного рогатого скота (BGD) |
BioHealthBase | Просмотрщик QTL Bovine | База данных генов EST крупного рогатого скота |
CGD | CGL | ChromDB |
Проект аннотации хромосомы 7 | CSHLmpd | База данных геномных вариантов |
DictyBase[5] | ДРОСПЕГ | EcoCyc |
FlyBase | Сравнительная геномика грибов | Обозреватель грибковых теломер |
Браузер Gallus Genome | GeneDB | GrainGenes |
Gramene | HapMap | Человек 2q33 |
База данных сегментарного дублирования генома человека | IVDB | МАГИ |
Базы данных по морским биологическим лабораторным организмам | Информатика генома мыши | База данных сегментарного дублирования, отличная от человека |
OMAP | OryGenesDB | Oryza Хромосома 8 |
Инструменты пути | ParameciumDB[6] | АрахисКарта |
РастенияDB | PlasmoDB | PomBase |
PseudoCAP | PossumBase | PUMAdb |
База данных генома крысы | База данных генома Saccharomyces | SGD Lite |
SmedDB | Сеть Sol Genomics | Soybase |
База данных Soybean Gbrowse | T1DBase | Информационный ресурс по арабидопсису |
TGD | Институт генома | Институт геномных исследований |
Браузер генома риса TIGR | ToxoDB | TriAnnot BAC Viewer |
VectorBase | wFleaBase[7] | WormBase |
XanthusBase | Xenbase |
Связанные проекты
- Bioperl, BioJava, Биопайтон, BioRuby, так далее.
- Ансамбль
- Генная онтология
- DAS
- Единая схема геномики
- Ламантин: ручной инструмент аннотации
- Biocurator.org
- Открытые биомедицинские онтологии
- Проект онтологии последовательности
Смотрите также
- Биологическая база данных
- Геномный проект
- Геномика
- Геном
- Компилятор генома - универсальная программная платформа для проектирования и визуализации ДНК, управления данными и совместной работы.
Рекомендации
- ^ Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример Чадо: основанная на онтологии модульная схема для представления связанной с геномом биологической информации». Биоинформатика. 23 (13): i337 – i346. Дои:10.1093 / биоинформатика / btm189. PMID 17646315.
- ^ Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельных организмов». Genome Res. 12 (10): 1599–610. Дои:10.1101 / гр. 403602. ЧВК 187535. PMID 12368253.
- ^ Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.». Исследования нуклеиновых кислот. 44 (W1): W3 – W10. Дои:10.1093 / нар / gkw343. ЧВК 4987906. PMID 27137889.
- ^ Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). «BeetleBase: база данных модельных организмов для Tribolium castaneum». Нуклеиновые кислоты Res. 35 (Выпуск базы данных): D476–9. Дои:10.1093 / нар / gkl776. ЧВК 1669707. PMID 17090595.
- ^ Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum". Нуклеиновые кислоты Res. 34 (Выпуск базы данных): D423–7. Дои:10.1093 / nar / gkj090. ЧВК 1347453. PMID 16381903.
- ^ Arnaiz O; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными». Нуклеиновые кислоты Res. 35 (Выпуск базы данных): D439–44. Дои:10.1093 / нар / gkl777. ЧВК 1669747. PMID 17142227.
- ^ Colbourne JK; Singan VR; Гилберт Д.Г. (2005). "wFleaBase: база данных генома дафний". BMC Bioinformatics. 6: 45. Дои:10.1186/1471-2105-6-45. ЧВК 555599. PMID 15752432.