КЕГГ - KEGG

КЕГГ
База данных KEGG logo.gif
Содержание
ОписаниеРесурс биоинформатики для расшифровки генома.
ОрганизмыВсе
Контакт
Исследовательский центрКиотский университет
ЛабораторияKanehisa Laboratories
Основное цитированиеPMID  10592173
Дата выхода1995
Доступ
Интернет сайтwww.kegg.jp
веб-сервис URLОТДЫХ видеть KEGG API
Инструменты
ИнтернетKEGG Mapper

КЕГГ (Киотская энциклопедия генов и геномов) представляет собой набор баз данных, касающихся геномы, биологические пути, болезни, наркотики, и химические субстанции. КЕГГ используется для биоинформатика исследования и образование, включая анализ данных в геномика, метагеномика, метаболомика и другие омики исследования, моделирование и моделирование в системная биология, и трансляционные исследования в разработка лекарств.

Вступление

Проект базы данных KEGG был инициирован в 1995 г. Минору Канехиса, Профессор Института химических исследований, Киотский университет, под тогдашним японским Программа генома человека.[1][2] Предвидение потребности в компьютеризированном ресурсе, который можно использовать для биологической интерпретации данные последовательности генома, он начал разработку базы данных KEGG PATHWAY. Это коллекция нарисованных вручную карт путей KEGG, представляющих экспериментальные знания о метаболизм и различные другие функции клетка и организм. Каждая карта путей содержит сеть молекулярных взаимодействий и реакций и предназначена для связи гены в геноме генные продукты (по большей части белки ) в пути. Это позволило провести анализ, называемый картированием путей KEGG, при котором содержание гена в геноме сравнивается с базой данных KEGG PATHWAY, чтобы изучить, какие пути и связанные с ними функции, вероятно, закодированы в геноме.

По словам разработчиков, KEGG - это «компьютерное представление» биологическая система.[3] Он объединяет строительные блоки и схемы соединений системы, в частности, генетические строительные блоки генов и белков, химические строительные блоки маленькие молекулы и реакции, и электрические схемы молекулярного взаимодействия и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые подразделяются на системные, геномные, химические и медицинские.[4]

Базы данных

Системная информация

База данных KEGG PATHWAY, база данных схем подключения, является ядром ресурса KEGG. Это набор карт путей, объединяющих множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени для лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты путей подразделяются на следующие разделы:

Раздел метаболизма содержит эстетически нарисованные глобальные карты, показывающие общую картину метаболизма, в дополнение к обычным картам метаболических путей. Глобальные карты с низким разрешением могут использоваться, например, для сравнения метаболических возможностей различных организмов в исследованиях геномики и различных образцов окружающей среды в исследованиях метагеномики. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные электрические схемы с более высоким разрешением, представляющие более узкие функциональные единицы в пределах карты путей, такие как подпути, сохраненные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые могут быть связаны с определенными метаболическими возможностями и другими фенотипический функции, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.

Еще одна база данных, дополняющая KEGG PATHWAY, - это база данных KEGG BRITE. Это онтология база данных, содержащая иерархические классификации различных сущностей, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих сущностей, KEGG BRITE включает в себя множество различных типов отношений.

Геномная информация

Спустя несколько месяцев после начала проекта KEGG в 1995 г., первый отчет о полностью последовательной бактериальный геном был опубликован.[5] С тех пор все опубликованные полные геномы накапливаются в KEGG для обоих эукариоты и прокариоты. База данных KEGG GENES содержит информацию на уровне генов / белков, а база данных KEGG GENOME содержит информацию на уровне организма для этих геномов. База данных KEGG GENES состоит из наборов генов для полных геномов, и гены в каждом наборе приведены аннотации в виде установления соответствий схемам подключения карт путей KEGG, модулей KEGG и иерархий BRITE.

Эти соответствия производятся с использованием концепции ортологи. Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они разработаны так, чтобы их можно было применить и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют одинаковые пути, состоящие из функционально идентичных генов, называемых ортологическими генами или ортологи. Все гены в базе данных KEGG GENES сгруппированы в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью аннотация генома процедура в КЕГГ.[4]

Химическая информация

Карты метаболических путей KEGG изображают двойные аспекты метаболической сети: геномную сеть того, как кодируется геном ферменты связаны, чтобы катализировать последовательные реакции и химическую сеть, как химические структуры субстраты и товары трансформируются этими реакциями.[6] Набор генов ферментов в геноме будет идентифицировать сети ферментных отношений при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать биосинтетический и биоразложение потенциалы организма. Как вариант, набор метаболиты Идентификация в метаболоме приведет к пониманию ферментативных путей и вовлеченных ферментных генов.

Базы данных категории химической информации, которые в совокупности называются KEGG LIGAND, организованы путем сбора информации о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций в номенклатуре ферментов.[7] В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов.[8] и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции).[9] KEGG COMPOUND также был расширен за счет включения различных соединений, таких как ксенобиотики, помимо метаболитов.

Информация о здоровье

В KEGG болезни рассматриваются как возмущенные состояния биологической системы, вызванные возмущающими воздействиями генетических факторов и факторов окружающей среды, а лекарства рассматриваются как различные типы возмущающих факторов.[10] База данных KEGG PATHWAY включает не только нормальные состояния, но и возмущенные состояния биологических систем. Однако карты путей распространения болезни не могут быть составлены для большинства болезней, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход используется в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды болезней. Эти каталоги могут в конечном итоге привести к более полным схемам заболеваний.

База данных KEGG DRUG содержит активные ингредиенты из одобренные препараты в Японии, США и Европе. Они различаются по химическому строению и / или химическим компонентам и связаны с цель молекулы метаболизирующие ферменты и другую информацию о сети молекулярного взаимодействия в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Сырые наркотики и другие вещества, связанные со здоровьем, которые не входят в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных в категории информации о здоровье вместе называются KEGG MEDICUS, что также включает вкладыши в пакеты всех препаратов, продаваемых в Японии.

Модель подписки

В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему доступен бесплатно через свой веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики.[11][12]

Смотрите также

Рекомендации

  1. ^ Канехиса М, Гото С (2000). "KEGG: Киотская энциклопедия генов и геномов". Нуклеиновые кислоты Res. 28 (1): 27–30. Дои:10.1093 / nar / 28.1.27. ЧВК  102409. PMID  10592173.
  2. ^ Канехиса М (1997). «База данных для постгеномного анализа». Тенденции Genet. 13 (9): 375–6. Дои:10.1016 / S0168-9525 (97) 01223-7. PMID  9287494.
  3. ^ Канехиса М., Гото С., Хаттори М., Аоки-Киношита К.Ф., Ито М., Кавасима С., Катаяма Т., Араки М., Хиракава М. (2006). «От геномики к химической геномике: новые разработки в KEGG». Нуклеиновые кислоты Res. 34 (Выпуск базы данных): D354–7. Дои:10.1093 / нар / gkj102. ЧВК  1347464. PMID  16381885.
  4. ^ а б Канехиса М., Гото С., Сато Й., Кавасима М., Фурумичи М., Танабэ М. (2014). «Данные, информация, знания и принципы: назад к метаболизму в KEGG». Нуклеиновые кислоты Res. 42 (Выпуск базы данных): D199–205. Дои:10.1093 / nar / gkt1076. ЧВК  3965122. PMID  24214961.
  5. ^ Флейшманн Р.Д., Адамс, доктор медицины, Уайт О., Клейтон Р.А., Киркнесс Э.Ф., Керлаваж А.Р., Булт С.Дж., Томб Дж.Ф., Догерти Б.А., Меррик Дж.М. и др. (1995). «Полногеномное случайное секвенирование и сборка Haemophilus influenzae Rd». Наука. 269 (5223): 496–512. Bibcode:1995Научный ... 269..496F. Дои:10.1126 / science.7542800. PMID  7542800. S2CID  10423613.
  6. ^ Канехиса М (2013). «Химическая и геномная эволюция сетей реакций, катализируемых ферментами». FEBS Lett. 587 (17): 2731–7. Дои:10.1016 / j.febslet.2013.06.026. HDL:2433/178762. PMID  23816707. S2CID  40074657.
  7. ^ Гото С., Нисиока Т., Канехиса М. (1999). «База данных LIGAND по ферментам, соединениям и реакциям». Нуклеиновые кислоты Res. 27 (1): 377–9. Дои:10.1093 / nar / 27.1.377. ЧВК  148189. PMID  9847234.
  8. ^ Хашимото К., Гото С., Кавано С., Аоки-Киношита К.Ф., Уэда Н., Хамадзима М., Кавасаки Т., Канехиса М. (2006). «KEGG как ресурс по информатике glycome». Гликобиология. 16 (5): 63R – 70R. Дои:10.1093 / гликоб / cwj010. PMID  16014746.
  9. ^ Муто А., Котера М., Токимацу Т., Накагава З., Гото С., Канехиса М. (2013). «Модульная архитектура метаболических путей, выявленная консервативными последовательностями реакций». Модель J Chem Inf. 53 (3): 613–22. Дои:10.1021 / ci3005379. ЧВК  3632090. PMID  23384306.
  10. ^ Канехиса М., Гото С., Фурумичи М., Танабэ М., Хиракава М. (2010). «KEGG для представления и анализа молекулярных сетей, включающих болезни и лекарства». Нуклеиновые кислоты Res. 38 (Выпуск базы данных): D355–60. Дои:10.1093 / нар / gkp896. ЧВК  2808910. PMID  19880382.
  11. ^ Гальперин М.Ю., Фернандес-Суарес XM (2012). "Выпуск базы данных исследований нуклеиновых кислот 2012 г. и онлайн-сборник базы данных по молекулярной биологии". Нуклеиновые кислоты Res. 40 (Проблема с базой данных): D1–8. Дои:10.1093 / нар / gkr1196. ЧВК  3245068. PMID  22144685.
  12. ^ Хайден, EC (2013). «Популярная база данных растений для взимания платы с пользователей». Природа. Дои:10.1038 / природа.2013.13642.

внешняя ссылка