OrthoDB - OrthoDB

OrthoDB
OrthoDB logo.png
Содержание
ОписаниеКаталог Ортологи.
Контакт
Исследовательский центрШвейцарский институт биоинформатики
ЛабораторияГруппа вычислительной эволюционной геномики
АвторыЕвгения Валерьевна Кривенцева
Основное цитированиеКривенцева и др. (2015)[1]
Дата выхода2007
Доступ
Интернет сайтwww.orthodb.org
Скачать URLhttps://www.orthodb.org/?page=filelist
Sparql конечная точкаsparql.orthodb.org/ sparql
Разное
ЛицензияCC-BY-3.0

OrthoDB [1][2][3][4] представляет каталог ортологичный гены, кодирующие белок позвоночные, членистоногие, грибы, растения, и бактерии. Ортология относится к последнему общему предку рассматриваемого вида, и, таким образом, OrthoDB явно очерчивает ортологи для каждого основного излучения в филогении вида. В базе ортологов представлены доступные дескрипторы белков вместе с Генная онтология и ИнтерПро атрибуты, которые служат для предоставления общих описательных аннотаций ортологичных групп и упрощения комплексных запросов к базе данных ортологии. OrthoDB также предоставляет вычисленные эволюционные черты ортологов, такие как профили дублируемости и потери генов, коэффициенты дивергенции, группы братьев и сестер и интрон-экзонную архитектуру генов.

В сравнительной геномике нельзя недооценивать важность масштаба. Поскольку определение генов ортологии требует определенных знаний и значительных вычислительных ресурсов, масштаб - это то, чего отдельные неспециализированные исследовательские группы не могут достичь самостоятельно. Эта непростая задача решается OrthoDB, с очень полным набором видов и несколькими уникальными функциями, такими как обширные функциональные и эволюционные аннотации ортологичных групп, с интеграцией множества полезных ссылок на другие ведущие в мире базы данных, которые сосредоточены на сборе информации о функциях генов. Ни один геном не может существовать как полезный источник данных без обширного сравнительного анализа с другими геномами - OrthoDB предоставляет критически важный ресурс сравнительной геномики для всего сообщества исследователей, от тех, кто интересуется большими эволюционными вопросами, до тех, кто сосредоточен на конкретных биологических функциях отдельных генов.

Методология

Ортология определяется относительно последнего общего предка рассматриваемого вида, тем самым определяя иерархический характер ортологических классификаций. Это явно рассматривается в OrthoDB путем применения процедуры разграничения ортологии в каждой крупной радиационной точке рассматриваемой филогении. В OrthoDB реализация использует алгоритм кластеризации Best-Reciprocal-Hit (BRH), основанный на принципе «все против всех». Смит – Уотерман сравнения белковых последовательностей. Предварительная обработка набора генов выбирает самый длинный кодирующий белок транскрипт альтернативно сплайсированных генов и очень похожих копий генов. Процедура триангулирует BRH для постепенного построения кластеров и требует общего минимального перекрытия выравнивания последовательностей, чтобы избежать обхода доменов. Эти основные кластеры дополнительно расширяются, чтобы включить всех более тесно связанных внутривидовых паралогов и ранее идентифицированные очень похожие копии генов.

Содержание данных

База данных содержит около 600 видов эукариот и более 3600 бактерий. [1] получено из Ансамбль, UniProt, NCBI, FlyBase, и несколько других баз данных. Постоянно увеличивающийся объем выборки секвенированных геномов дает более ясное представление о большинстве генеалогий генов, что облегчит обоснованные гипотезы функции генов во вновь секвенированных геномах.

Примеры исследований, в которых использовались данные OrthoDB включают сравнительный анализ эволюции репертуара генов,[5][6] сравнение генов развития плодовых мух и комаров,[7] анализ изменений экспрессии генов у комаров, вызванных кровопролитием или инфекцией,[8][9][10] анализ эволюции молочной продуктивности млекопитающих,[11] и ген комара и эволюция генома.[12] Другие исследования, цитирующие OrthoDB можно найти на PubMed и Google ученый.

Спектакль

OrthoDB стабильно хорошо зарекомендовала себя в сравнительных оценках наряду с другими процедурами определения ортологии. Результаты сравнивали с эталонными деревьями для трех хорошо консервативных семейств белков,[13] и большему набору тщательно отобранных семейств белков.[14]

BUSCO

Bнаборов Uуниверсальный SiзаботаCопи Оrthologs [15] - Ортологические группы выбираются из OrthoDB для классификации на корневом уровне членистоногих, позвоночных, многоклеточных, грибов и других основных клад. Группы должны содержать однокопийные ортологи по крайней мере у 90% видов (у других они могут быть потеряны или дублированы), и все отсутствующие виды не могут быть из одной клады. Виды с частыми потерями или дупликациями удаляются из выборки, если они не занимают ключевую позицию в филогении. БУСКО поэтому ожидается, что они будут обнаружены в виде ортологов с единственной копией в любом вновь секвенированном геноме из соответствующей филогенетической клады и могут быть использованы для анализа вновь секвенированных геномов для оценки их относительной полноты. В BUSCO инструмент оценки и наборы данных (доступны здесь ) широко используются во многих проектах по геномике, и теперь большинство редакторов журналов требуют такой оценки качества перед принятием новых публикаций по геному.

Примечания и ссылки

  1. ^ а б c Кривенцева Е.В., Тегенфельдт Ф., Петти Т.Дж., Уотерхаус Р.М., Симау Ф.А., Поздняков И.А., Иоаннидис П., Здобавов Е.М. (январь 2015 г.). «OrthoDB v8: обновление иерархического каталога ортологов и лежащего в основе бесплатного программного обеспечения». Нуклеиновые кислоты Res. 43 (Выпуск базы данных): D250–6. Дои:10.1093 / нар / gku1220. ЧВК  4383991. PMID  25428351.
  2. ^ Уотерхаус Р.М., Тегенфельдт Ф., Ли Дж., Здобавов Е.М., Кривенцева Е.В. (январь 2013 г.). «OrthoDB: иерархический каталог ортологов животных, грибов и бактерий». Нуклеиновые кислоты Res. 41 (Выпуск базы данных): D358–65. Дои:10.1093 / нар / гкс1116. ЧВК  3531149. PMID  23180791.
  3. ^ Уотерхаус Р.М., Здобнов Е.М., Тегенфельдт Ф., Ли Дж., Кривенцева Е.В. (январь 2011 г.). «OrthoDB: иерархический каталог ортологов эукариот 2011 года». Нуклеиновые кислоты Res. 39 (Выпуск базы данных): D283–8. Дои:10.1093 / nar / gkq930. ЧВК  3013786. PMID  20972218.
  4. ^ Кривенцева Е.В., Рахман Н., Эспиноза О., Здобавов Е.М. (янв 2008). "OrthoDB: иерархический каталог ортологов эукариот". Нуклеиновые кислоты Res. 36 (Выпуск базы данных): D271–5. Дои:10.1093 / нар / гкм845. ЧВК  2238902. PMID  17947323.
  5. ^ Уотерхаус Р.М., Здоровнов Е.М., Кривенцева Е.В. (январь 2011 г.). «Корреляционные признаки сохранения генов, расхождения последовательностей, дублируемости и существенности у позвоночных, членистоногих и грибов». Genome Biol. Evol. 3: 75–86. Дои:10.1093 / gbe / evq083. ЧВК  3030422. PMID  21148284.
  6. ^ Хасэ Т., Ниймура Ю., Танака Х (2010). «Различие в дуплицируемости генов может объяснить разницу в общей структуре сетей белок-белкового взаимодействия у эукариот». BMC Evol. Биол. 10: 358. Дои:10.1186/1471-2148-10-358. ЧВК  2994879. PMID  21087510.
  7. ^ Бехура С.К., Хауген М., Фланнери Е., Сарро Дж., Тессье С.Р., Северсон Д.В., Думан-Шил М. (2011). «Сравнительный геномный анализ генов развития Drosophila melanogaster и Vector Mosquito». PLOS ONE. 6 (7): e21504. Bibcode:2011PLoSO ... 621504B. Дои:10.1371 / journal.pone.0021504. ЧВК  3130749. PMID  21754989.
  8. ^ Бониццони М., Данн В.А., Кэмпбелл К.Л., Олсон К.Э., Даймон М.Т., Маринотти О., Джеймс А.А. (2011). «Анализ РНК-seq индуцированных кровью изменений экспрессии генов у видов-переносчиков комаров, Aedes aegypti». BMC Genomics. 12: 82. Дои:10.1186/1471-2164-12-82. ЧВК  3042412. PMID  21276245.
  9. ^ Пинто С.Б., Ломбардо Ф., Коутсос А.С., Уотерхаус Р.М., Маккей К., Ан С., Рамакришнан С., Кафатос ФК, Мишель К. (2009). «Открытие модуляторов плазмодия путем полногеномного анализа циркулирующих гемоцитов у Anopheles gambiae». Proc Natl Acad Sci U S A. 106 (50): 21270–5. Bibcode:2009ПНАС..10621270П. Дои:10.1073 / pnas.0909463106. ЧВК  2783009. PMID  19940242.
  10. ^ Bartholomay LC, Waterhouse RM, Mayhew GF, Campbell CL, Michel K, Zou Z, Ramirez JL, Das S, Alvarez K, Arensburger P, Bryant B, Chapman SB, Dong Y, Erickson SM, Karunaratne SH, Kokoza V, Kodira CD , Pignatelli P, Shin SW, Vanlandingham DL, Atkinson PW, Birren B, Christophides GK, Clem RJ, Hemingway J, Higgs S, Megy K, Ranson H, Zdobnov EM, Raikhel AS, Christensen BM, Dimopoulos G, Muskavitch MA (2010 г. ). «Патогеномика Culex quinquefasciatus и метаанализ инфекционных реакций на различные патогены». Наука. 330 (6000): 88–90. Bibcode:2010Научный ... 330 ... 88B. Дои:10.1126 / science.1193162. ЧВК  3104938. PMID  20929811.
  11. ^ Lemay DG, Lynn DJ, Martin WF, Neville MC, Casey TM, Rincon G, Kriventseva EV, Barris WC, Hinrichs AS, Molenaar AJ, Pollard KS, Maqbool NJ, Singh K, Murney R, Zdobnov EM, Tellam RL, Medrano JF , Немецкий JB, Rijnkels M (2009). «Геном кормления крупного рогатого скота: понимание эволюции молока млекопитающих». Геном Биол. 10 (4): R43. Дои:10.1186 / gb-2009-10-4-r43. ЧВК  2688934. PMID  19393040.
  12. ^ Neafsey DE, Waterhouse RM, Abai MR, Aganezov SS, Alexseyev MA, Allen JE, Amon J, Arcà B, Arensburger P, Artemov G, Assour LA, Basseri H, Berlin A, Birren BW, Blandin SA, Brockman AI, Burkot TR , Берт А., Чан С.С., Чов С., Чиу Дж. К., Кристенсен М., Костантини С., Дэвидсон В. Л., Делиджанни Э, Дотторини Т., Дритсу В., Габриэль С. Б., Гельбеого В. М., Холл А. Б., Хан М. В., Хлаинг Т., Хьюз Д. С., Дженкинс AM, Jiang X, Jungreis I, Kakani EG, Kamali M, Kemppainen P, Kennedy RC, Kirmitzoglou IK, Koekemoer LL, Laban N, Langridge N, Lawniczak MK, Lirakis M, Lobo NF, Lowy E, MacCallum RM, Mao C, Маслен Дж., Мбого С., Маккарти Дж., Мишель К., Митчелл С. Н., Мур В., Мерфи К. А., Науменко А. Н., Нолан Т., Новоа Е. М., О'Лафлин С., Орингандже С., Ошаги М. А., Пакпур Н., Папатанос П. А., Пири А. Н., Повелонес М., Пракаш А., Прайс Д.П., Раджараман А., Реймер Л.Дж., Ринкер Д.К., Рокас А., Рассел Т.Л., Саньон Н., Шарахова М.В., Ши Т., Симао Ф.А., Симард Ф., Слотман М.А., Сомбун П., Стегний В., Стручинер С.Дж. , Thomas GW, Tojo M, Topalis P, Tubio JM, Unger MF, Vontas Дж., Уолтон К., Уилдинг К. С., Уиллис Дж. Х., Ву Ю. К., Ян Дж., Здобавов Е. М., Чжоу Х, Каттеручча Ф., Кристофидес Г. К., Коллинз Ф. Х., Корнман Р. С., Крисанти А., Доннелли М. Дж., Эмрих С. ​​Дж., Фонтейн М. К., Гелбарт В., Хан М.В., Хансен И.А., Хауэлл П.И., Кафатос ФК, Келлис М., Лоусон Д., Луис С., Лакхарт С., Маскавич М.А., Рибейро Дж. М., Риле М.А., Шарахов И.В., Ту Зи, Цвибель Л.Дж., Бесанский Н.Дж. (январь 2015 г.). «Высокоэволюционирующие переносчики малярии: геномы 16 комаров Anopheles». Наука. 347 (6217): 62176. Bibcode:2015Научный ... 347 ... 43N. Дои:10.1126 / science.1258522. ЧВК  4380271. PMID  25554792.
  13. ^ Бёкманн Б., Робинсон-Рехави М., Ксенариос I, Дессимоз С. (сентябрь 2011 г.). «Концептуальная основа и пилотное исследование для сравнительного анализа филогеномных баз данных на основе эталонных генов». Краткий. Биоинформ. 12 (5): 423–35. Дои:10.1093 / bib / bbr034. ЧВК  3178055. PMID  21737420.
  14. ^ http://eggnog.embl.de/orthobench OrthoBench]
    Трачана К., Ларссон Т.А., Пауэлл С., Чен У.Х., Дёркс Т., Мюллер Дж., Борк П. (октябрь 2011 г.). «Методы прогнозирования ортологии: оценка качества с использованием специально подобранных семейств белков». BioEssays. 33 (10): 769–80. Дои:10.1002 / bies.201100062. ЧВК  3193375. PMID  21853451.
  15. ^ Симау Ф.А., Уотерхаус Р.М., Иоаннидис П., Кривенцева Е.В., Здобнов Е.М. (июнь 2015 г.). «БУСКО: оценка сборки генома и полноты аннотации с помощью ортологов с единственной копией». Биоинформатика. 31 (19): 3210–2. Дои:10.1093 / биоинформатика / btv351. PMID  26059717.

Смотрите также

внешняя ссылка