Генная онтология - Gene ontology
Содержание | |
---|---|
Описание | Ресурс с контролируемый словарный запас описать функцию гены и генные продукты |
Доступ | |
Интернет сайт | генеонтология |
В Генная онтология (ИДТИ) является основным биоинформатика инициатива по унификации представительства ген и генный продукт атрибуты по всем разновидность.[1] В частности, проект направлен на: 1) поддержание и развитие своего контролируемый словарный запас атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения.[2][3] GO является частью более крупной классификации, Открытые биомедицинские онтологии, являясь одним из первых кандидатов в члены OBO Foundry.[4]
В то время как номенклатура генов фокусируется на генах и генных продуктах, генная онтология сосредотачивается на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки для получения данных (не только о генах и их продуктах, но и о тщательно подобранных атрибутах) машиночитаемый, и делать это таким образом, чтобы это было едино для всех видов (тогда как соглашения о номенклатуре генов различаются в зависимости от биологических таксон ).
Термины и онтология
С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, и взаимосвязей между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, а использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательская группа. Это затрудняет обмен данными и обмен данными. Проект Gene Ontology предоставляет онтология определенных терминов, представляющих генный продукт характеристики. Онтология охватывает три области:
- клеточный компонент, части клетка или его внеклеточный среда;
- молекулярная функция, элементная активность генного продукта на молекулярном уровне, например связывание или катализ;
- биологический процесс, операции или наборы молекулярных событий с определенным началом и концом, относящиеся к функционированию интегрированных живых единиц: клеток, ткани, органы, и организмы.
Каждый термин GO в онтологии имеет имя термина, которое может быть словом или строкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как полностью эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как ориентированный ациклический граф, и каждый термин определил отношения к одному или нескольким другим терминам в том же домене, а иногда и к другим доменам. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариоты и эукариоты, Один и многоклеточные организмы.
GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO.[5] Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например,[6]). Предлагаемые изменения проверяются редакторами онтологий и при необходимости применяются.
Файлы онтологии и аннотации GO находятся в свободном доступе на веб-сайте GO.[7] в нескольких форматах или доступны в Интернете с помощью браузера GO AmiGO. Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.
Пример термина
- id: GO: 0000016
- название: активность лактазы
- онтология: молекулярная функция
- def: «Катализ реакции: лактоза + H2O = D-глюкоза + D-галактоза». [EC: 3.2.1.108]
- синоним: «активность лактазы-флоризингидролазы» ШИРОКО [EC: 3.2.1.108]
- синоним: «активность лактозогидролазы» ТОЧНО [EC: 3.2.1.108]
- xref: EC: 3.2.1.108
- xref: MetaCyc: LACTASE-RXN
- xref: Reactome: 20536
- is_a: GO: 0004553! гидролазная активность, гидролизующие О-гликозильные соединения
Источник данных:[8]
Аннотации
Аннотации генома охватывает практику сбора данных о генном продукте, а в аннотациях GO для этого используются термины из GO. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO.[9] Помимо идентификатора генного продукта и соответствующего термина GO, аннотации GO содержат как минимум следующие данные: ссылка используется для аннотации (например, журнальной статьи); An код доказательства обозначение типа свидетельства, на котором основывается аннотация; Дата и автор аннотации
В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых доказательств, а также дополнительная информация, такая как условия, при которых наблюдается функция.
Код доказательств взят из контролируемый словарный запас кодов, онтология кода свидетельства, охватывающая как ручные, так и автоматизированные методы аннотации.[10] Например, Заявление отслеживаемого автора (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные для этой аннотации содержат ссылку на эту статью; Выводится из сходства последовательностей (ISS) означает, что куратор проанализировал результаты поиска по сходству последовательностей и подтвердил их биологическое значение. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код Предполагается из электронной анотации (МЭА). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений.[11][12]Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым и менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Чтобы поддержать разработку аннотаций, Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.
Много машинное обучение были разработаны и реализованы алгоритмы для прогнозирования аннотаций генных онтологий.[13][14]
Пример аннотации
- Генный продукт: актин, альфа-сердечная мышца 1, UniProtKB: P68032
- Срок действия: сердечное сокращение; GO: 0060047 (биологический процесс)
- Код доказательства: выведен из мутантного фенотипа (IMP)
- Ссылка: PMID 17611253
- Назначен: UniProtKB, 6 июня 2008 г.
Источник данных:[15]
Инструменты
Доступно большое количество инструментов[16] как онлайн, так и для загрузки, использующие данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit.
AmiGO[17][9] это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет ВЗРЫВ инструмент,[18] инструменты, позволяющие анализировать большие наборы данных,[19][20] и интерфейс для прямого запроса базы данных GO.[21]
AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или его можно загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например,[22]). Это бесплатно программное обеспечение с открытым исходным кодом и доступен как часть распространения программного обеспечения go-dev.[23]
OBO-Edit[24] - это редактор онтологий с открытым исходным кодом, независимый от платформы, разработанный и поддерживаемый Gene Ontology Consortium. Он реализован в Ява, и использует ориентированный на граф подход к отображению и редактированию онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет рассуждающий которые могут выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя он был разработан для биомедицинских онтологий, OBO-Edit можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания.[23]
Консорциум
Консорциум Gene Ontology - это набор биологические базы данных и исследовательские группы, активно участвующие в проекте генной онтологии.[12] Это включает в себя ряд модельный организм базы данных и многовидовые белковые базы данных, группы разработки программного обеспечения и отдельная редакция.
История
Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы из трех модельные организмы: Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи).[25] Много других Базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект.[7] По состоянию на июль 2019 года GO содержит 44 945 терминов; Есть 6 408 283 аннотаций к 4 467 различным биологическим организмам.[7] Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в биоинформатика арсенал. Их цели включают три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.
Также начинает появляться несколько анализов генной онтологии с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, онтологический анализ биологических онтологий см.[26]
Смотрите также
- Blast2GO[27]
- База данных сравнительной токсикогеномики
- ДЭВИД биоинформатика
- Интерфером
- Национальный центр биомедицинской онтологии
Рекомендации
- ^ Консорциум генных онтологий (январь 2008 г.). «Проект генной онтологии в 2008 году». Исследования нуклеиновых кислот. 36 (Выпуск базы данных): D440–4. Дои:10.1093 / нар / гкм883. ЧВК 2238979. PMID 17984083.
- ^ Дессимоз, Кристоф; Škunca, Nives, eds. (2017). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Дои:10.1007/978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.
- ^ Годе, Паскаль; Шкунца, Нивес; Ху, Джеймс С .; Дессимоз, Кристоф (2017). «Букварь по онтологии генов». Справочник по генной онтологии. Методы молекулярной биологии. 1446. С. 25–37. Дои:10.1007/978-1-4939-3743-1_3. ISBN 978-1-4939-3741-7. ISSN 1064-3745. ЧВК 6377150. PMID 27812933.
- ^ Смит Б., Эшбёрнер М., Россе С., Бард Дж., Баг В., Цеустерс В., Голдберг Л.Дж., Эйлбек К., Ирландия А., Мунгалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансон С.А., Шойерманн Р.Х., Шах Н., Whetzel PL, Lewis S (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных». Природа Биотехнологии. 25 (11): 1251–5. Дои:10.1038 / nbt1346. ЧВК 2814061. PMID 17989687.
- ^ Ловеринг, Рут С. (2017). «Как научное сообщество вносит свой вклад в генную онтологию?». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Спрингер (Нью-Йорк). С. 85–93. Дои:10.1007/978-1-4939-3743-1_7. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812937.
- ^ Диль А.Д., Ли Дж.А., Шойерманн Р.Х., Блейк Дж. (Апрель 2007 г.). «Разработка онтологии биологических систем: иммунология». Биоинформатика. 23 (7): 913–5. Дои:10.1093 / биоинформатика / btm029. PMID 17267433.
- ^ а б c "Ресурс генной онтологии". Консорциум генных онтологий.
- ^ Сджкарбон, Wiki Консорциума генных онтологий (2013-07-10). "AmiGO_2_Manual: term_Page" (HTML).
- ^ а б AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
- ^ «Онтология кода свидетельств». Онтология кода свидетельств.
- ^ дю Плесси Л., Скунка Н., Дессимоз С. (ноябрь 2011 г.). «Что, где, как и почему онтологии генов - учебник для биоинформатиков». Брифинги по биоинформатике. 12 (6): 723–35. Дои:10.1093 / bib / bbr002. ЧВК 3220872. PMID 21330331.
- ^ а б «Консорциум ГО». Получено 2009-03-16.
- ^ Пиноли П., Чикко Д., Массероли М. (июнь 2013 г.). «Вычислительные алгоритмы для прогнозирования аннотации генной онтологии». BMC Bioinformatics. 16 (6): S4. Дои:10.1186 / 1471-2105-16-S6-S4. ЧВК 4416163. PMID 25916950.
- ^ Коццетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы передачи аннотаций из последовательности». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии. Методы молекулярной биологии. 1446. Спрингер (Нью-Йорк). С. 55–67. Дои:10.1007/978-1-4939-3743-1_5. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812935.
- ^ Консорциум GO (16 марта 2009 г.). "AmiGO: P68032 Ассоциации".
- ^ Mosquera JL, Sánchez-Pla A (июль 2008 г.). «SerbGO: в поисках лучшего инструмента GO». Исследования нуклеиновых кислот. 36 (Выпуск веб-сервера): W368–71. Дои:10.1093 / нар / gkn256. ЧВК 2447766. PMID 18480123.
- ^ Углерод С., Ирландия А., Мунгалл С. Дж., Шу С., Маршал Б., Льюис С. (январь 2009 г.). AmiGO Hub; Рабочая группа по веб-присутствию. «AmiGO: онлайн-доступ к онтологическим и аннотационным данным». Биоинформатика. 25 (2): 288–9. Дои:10.1093 / биоинформатика / btn615. ЧВК 2639003. PMID 19033274.
- ^ «Инструмент AmiGO BLAST». Архивировано из оригинал на 2011-08-20. Получено 2009-03-13.
- ^ Инструмент расширения терминов AmiGO В архиве 2008-04-07 на Wayback Machine; находит важные общие термины GO в наборе аннотаций
- ^ AmiGO Slimmer В архиве 2011-09-29 на Wayback Machine; отображает подробные аннотации до терминов высокого уровня
- ^ ГУСЬ, GO Online SQL Environment; позволяет выполнять прямой SQL-запрос к базе данных GO
- ^ Консорциум онтологии растений (16 марта 2009 г.). «Консорциум онтологии растений». Получено 2009-03-16.
- ^ а б "Онтология генов загружается на SourceForge". Получено 2009-03-16.
- ^ Дэй-Рихтер Дж., Харрис М.А., Хендель М., Льюис С. (Август 2007 г.). «OBO-Edit - редактор онтологий для биологов». Биоинформатика. 23 (16): 2198–200. Дои:10.1093 / биоинформатика / btm112. PMID 17545183.
- ^ Ashburner M, Ball CA, Блейк Дж., Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM , Шерлок Джи (май 2000 г.). «Генная онтология: инструмент для объединения биологии. Консорциум генных онтологий». Природа Генетика. 25 (1): 25–9. Дои:10.1038/75556. ЧВК 3037419. PMID 10802651.
- ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий». Границы генетики. 3: 269. Дои:10.3389 / fgene.2012.00269. ЧВК 3509948. PMID 23226158.
- ^ Гётц С., Гарсия-Гомес Дж. М., Терол Дж., Уильямс Т. Д., Нагарадж С.Х., Нуеда М.Дж., Роблес М., Талон М., Допазо Дж., Конеса А. (июнь 2008 г.). «Функциональная аннотация и интеллектуальный анализ данных с высокой пропускной способностью с помощью пакета Blast2GO». Исследования нуклеиновых кислот. 36 (10): 3420–35. Дои:10.1093 / nar / gkn176. ЧВК 2425479. PMID 18445632.
внешняя ссылка
- AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
- Консорциум генных онтологий - официальный сайт
- PlantRegMap - аннотация GO для 165 видов растений и анализ обогащения GO
- SimCT - веб-инструмент для отображения взаимосвязей между биологическими объектами, аннотированными онтологией, в виде дерева кластеризации.
- SerbGO - инструмент GO для сравнения возможностей различных программ, чтобы показать их общие особенности и различия, а также определить, какие инструменты, если таковые имеются, обладают некоторыми специфическими необходимыми для пользователя возможностями для анализа GO.
- Доменно-ориентированная онтология генов - база данных предметно-ориентированных онтологий по функциям, фенотипам, заболеваниям и др.