Проект "Микробиом Земли" - Earth Microbiome Project
В Проект "Микробиом Земли" (EMP) - это инициатива, основанная Робом Найтом в 2010 году для сбора природных образцов и анализа микробного сообщества по всему миру.
Микробы очень многочисленны, разнообразны и играют важную роль в экологической системе.[который? ] Например, в океане содержится примерно 1,3 × 1028 архей ячеек, 3,1 × 1028 бактериальный ячеек, и 1 × 1030 вирус частицы.[1][2] Бактериальное разнообразие, мера количества типы бактерий в сообществе, по оценкам, составляет около 160 на мл океанской воды, 6 400–38 000 на 1 г почвы и 70 на 1 мл очистных сооружений.[2] Еще по состоянию на 2010 год[Обновить], было подсчитано, что в результате глобальных усилий по секвенированию ДНК в окружающей среде было получено менее 1 процента общей ДНК, обнаруженной в литре морской воды или грамме почвы,[3] и конкретные взаимодействия между микробами в значительной степени неизвестны.
EMP нацелен на обработку до 200000 образцов в различных биомы, создание полной базы данных микробов на Земле для характеристики окружающей среды и экосистем по микробному составу и взаимодействию. Используя эти данные, можно предложить и проверить новые экологические и эволюционные теории.[4]
Актеры
Неправительственный международный проект был запущен в 2010 году. По состоянию на январь 2018 года в него вошло 161 учреждение, все из которых являются университетами и учреждениями, входящими в их состав, за исключением IBM Research и Зоопарк Атланты. Краудсорсинг пришел из Фонд Джона Темплтона, то Фонд В. М. Кека, то Аргоннская национальная лаборатория Министерством энергетики США Австралийский исследовательский совет, Тульский фонд и Фонд Сэмюэля Лоуренса. Компании оказали поддержку в натуральной форме, включая MO BIO Laboratories, Luca Technologies, Eppendorf, Boreal Genomics, Иллюмина, Рош и Интегрированные ДНК-технологии.[5]
Цели
Основная цель[кем? ] проекта "Микробиом Земли" (EMP).[когда? ] для изучения микробного состава во многих средах по всей планете, во времени и в пространстве, используя стандартный набор протоколов. Разработка стандартизованных протоколов жизненно важна, потому что вариации в экстракции, амплификации, секвенировании и анализе образцов вносят систематические ошибки, которые делают недействительными сравнения структуры микробного сообщества.[6]
Другая важная цель - определить, как на реконструкцию микробных сообществ влияют аналитические ошибки. Темпы технического прогресса высоки, и необходимо понимать, как данные, полученные с использованием обновленных протоколов, будут сравниваться с данными, собранными с использованием более ранних методов. Информация из этого проекта будет храниться в базе данных для облегчения анализа. Другие результаты будут включать глобальный атлас функций белков и каталог повторно собранных геномов, классифицированных по их таксономическому распределению.[6]
Методы
Стандартные протоколы отбора проб, выделения ДНК, 16S рРНК усиление 18S рРНК усиление и "дробовик " метагеномика были разработаны или находятся в стадии разработки.[7]
Сбор образцов
Образцы будут собираться с использованием соответствующих методов из различных сред, включая глубокий океан, пресноводные озера, песок пустыни и почву. По возможности будут использоваться стандартизированные протоколы сбора, чтобы результаты были сопоставимы. Микробы из природных образцов не всегда можно культивировать. Из-за этого будут использоваться метагеномные методы для секвенирования всей ДНК или РНК в образце независимо от культуры.
Влажная лаборатория
В мокрой лаборатории обычно требуется выполнить серию процедур для отбора и очистки микробной части образцов. Процесс очистки может сильно отличаться в зависимости от типа образца. ДНК будут извлечены из частиц почвы, или микробы будут сконцентрированы с использованием ряда методов фильтрации. Кроме того, для увеличения выхода ДНК можно использовать различные методы амплификации. Например, не-ПЦР основан Многократное усиление смещения некоторые исследователи отдают предпочтение. Экстракция ДНК, использование праймеров и протоколы ПЦР - все это области, которые во избежание систематической ошибки необходимо выполнять в соответствии с тщательно стандартизованными протоколами.[6]
Последовательность действий
В зависимости от биологического вопроса исследователи могут выбрать секвенирование метагеномного образца, используя два основных подхода. Если биологический вопрос, который необходимо решить, заключается в том, какие типы организмов присутствуют и в каком количестве, предпочтительным подходом будет нацеливание и амплификация конкретного гена, который является высококонсервативным среди представляющих интерес видов. В 16S рибосомная РНК ген бактерий и 18S рибосомная РНК Ген для простейших часто используется в качестве генов-мишеней для этой цели. Преимущество нацеливания на конкретный ген заключается в том, что ген можно амплифицировать и секвенировать с очень высоким охватом. Этот подход называется «глубоким секвенированием», который позволяет идентифицировать редкие виды в образце. Однако этот подход не позволит собрать какие-либо целые геномы и не предоставит информацию о том, как организмы могут взаимодействовать друг с другом. Второй подход называется метагеномикой дробовика, при котором вся ДНК в образце разрезается и случайные фрагменты секвенируются. В принципе, этот подход позволяет собрать целые микробные геномы и сделать вывод о метаболических отношениях. Однако, если большинство микробов не охарактеризованы в данной среде, de novo сборка будет дорогостоящей в вычислительном отношении.[8]
Анализ данных
EMP предлагает стандартизировать биоинформатика аспекты обработки образцов.[6]
Анализ данных обычно включает следующие шаги: 1) Очистка данных. Предварительная процедура очистки любых считываний с низкими показателями качества, удаление любых последовательностей, содержащих "N" или неоднозначные нуклеотиды, и 2) присвоение таксономии последовательностям, что обычно выполняется с использованием таких инструментов, как ВЗРЫВ[9] или же RDP.[10] Очень часто обнаруживаются новые последовательности, которые не могут быть сопоставлены с существующей таксономией. В этом случае таксономия происходит от филогенетическое дерево который создан с новыми последовательностями и пулом близкородственных известных последовательностей.[11]
В зависимости от технологии секвенирования и основного биологического вопроса могут использоваться дополнительные методы. Например, если последовательные чтения слишком короткие, чтобы вывести какую-либо полезную информацию, потребуется сборка. Сборка также может быть использована для создания целых геномов, которые предоставят полезную информацию о видах. Кроме того, если необходимо понять метаболические взаимоотношения внутри микробного метагенома, последовательности ДНК необходимо транслировать в аминокислотные последовательности, например, с использованием инструментов прогнозирования генов, таких как GeneMark.[12] или FragGeneScan.[13]
Выход проекта
Четыре ключевых результата ПУОС:[14]
- Все первичные данные, полученные в рамках проекта «Микробиом Земли», независимо от степени их достоверности, будут храниться в централизованной базе данных под названием «Генный атлас» (GA). GA будет иметь данные о последовательности, аннотации и метаданные окружающей среды. Известные, а также неизвестные последовательности, т.е. "Темная материя" будет включена в надежде, что со временем неизвестные последовательности будут охарактеризованы.
- Собранные геномы, аннотированные с помощью автоматизированного конвейера, будут храниться в "Собранных геномах микробиома Земли" (EM-AG) в общедоступных репозиториях. Это позволит провести сравнительный геномный анализ.
- Интерактивная визуализация данных будет обеспечиваться через «Портал визуализации микробиома Земли» (EM-VIP), который позволит просматривать взаимосвязь между микробным составом, параметрами окружающей среды и геномной функцией.
- Реконструированные метаболические профили будут предложены в рамках «Метаболической реконструкции микробиома Земли» (EMMR).
Вызовы
Большие объемы данных о последовательностях, полученные в результате анализа различных микробных сообществ, сложно хранить, систематизировать и анализировать. Проблема усугубляется короткими чтениями, обеспечиваемыми платформой высокопроизводительного секвенирования, которая будет стандартным инструментом, используемым в проекте EMP. Потребуются улучшенные алгоритмы, улучшенные инструменты анализа, огромные объемы компьютерной памяти и доступ к многим тысячам часов суперкомпьютерного времени.[8]
Другой проблемой будет большое количество ожидаемых ошибок секвенирования. Секвенирование нового поколения технологии обеспечивают огромную пропускную способность, но более низкую точность, чем старые методы секвенирования. При секвенировании одного генома присущая этим методам более низкая точность гораздо более чем компенсируется способностью покрывать весь геном несколько раз в противоположных направлениях из нескольких начальных точек, но эта возможность не обеспечивает повышения точности при секвенировании разнообразной смеси. геномов. Возникает вопрос, как отличить ошибки секвенирования от реального разнообразия собранных микробных образцов?[8]
Несмотря на выпуск стандартных протоколов, ожидается систематическая ошибка от лаборатории к лаборатории. Необходимость амплификации ДНК из образцов с низкой биомассой внесет дополнительные искажения в данные. Сборка геномов даже доминирующих организмов в разнообразной выборке организмов требует гигабайт данных о последовательностях.[8]
EMP должен избегать проблемы, которая стала широко распространенной в общедоступных базах данных последовательностей. С продвижением в высокопроизводительное секвенирование технологий, многие последовательности попадают в общедоступные базы данных без экспериментально определенной функции, но аннотированы на основе наблюдаемых гомологий с известной последовательностью. Первая известная последовательность используется для аннотирования первой неизвестной последовательности, но происходит то, что первая неизвестная последовательность используется для аннотирования второй неизвестной последовательности и так далее. Гомология последовательностей является лишь умеренно надежным предсказателем функции.[15]
Смотрите также
Примечания
- ^ Саттл, К. А. (2007). «Морские вирусы - основные игроки в глобальной экосистеме». Обзоры природы Микробиология. 5 (10): 801–812. Дои:10.1038 / nrmicro1750. PMID 17853907. S2CID 4658457.
- ^ а б Curtis, T. P .; Sloan, W. T .; Сканнелл, Дж. У. (2002). «Оценка прокариотического разнообразия и его ограничений». Труды Национальной академии наук. 99 (16): 10494–10499. Дои:10.1073 / pnas.142680199. ЧВК 124953. PMID 12097644.
- ^ Гилберт, Дж. А .; Мейер, Ф .; Antonopoulos, D .; Balaji, P .; Brown, C.T .; Brown, C.T .; Desai, N .; Eisen, J. A .; Evers, D .; Филд, Д .; Feng, W .; Huson, D .; Jansson, J .; Knight, R .; Knight, J .; Kolker, E .; Константиндис, К .; Костка, Дж .; Kyrpides, N .; MacKelprang, R .; McHardy, A .; Айва, C .; Raes, J .; Sczyrba, A .; Тень, А .; Стивенс Р. (2010). "Отчет о встрече: семинар по терабазной метагеномике и видение проекта микробиома Земли". Стандарты геномных наук. 3 (3): 243–248. Дои:10.4056 / sigs.1433550. ЧВК 3035311. PMID 21304727.
- ^ Гилберт, Дж. А .; O'Dor, R .; King, N .; Фогель, Т. М. (2011). «Важность метагеномных исследований для микробной экологии: или почему Дарвин был бы метагеномным ученым». Микробная информатика и эксперименты. 1 (1): 5. Дои:10.1186/2042-5783-1-5. ЧВК 3348666. PMID 22587826.
- ^ Проект «Микробиом Земли» - это систематическая попытка охарактеризовать глобальное таксономическое и функциональное разнообразие микробов на благо планеты и человечества. Earth Microbiome Project 2018, данные получены 3 января 2018 г.
- ^ а б c d Gilbert, J.A .; Мейер, Ф. (2012). «Моделирование микробиома Земли». Журнал Microbe. 7 (2): 64–69. Дои:10.1128 / microbe.7.64.1.
- ^ "Проект" Микробиом Земли / Стандартные протоколы ". Архивировано из оригинал на 2012-03-16. Получено 2012-03-07.
- ^ а б c d Янссон, Джанет (2011). «Навстречу« Тера-Терра »: терабазное секвенирование наземных метагеномов». Журнал Microbe. 6 (7): 309–15. Дои:10.1128 / microbe.6.309.1.
- ^ "BLAST: Базовый инструмент поиска местного выравнивания".
- ^ «Проект базы данных рибосом». Получено 2012-03-06.
- ^ Мейер, Ф .; Paarmann, D .; d'Souza, M .; Olson, R .; Glass, E.M .; Кубал, М .; Paczian, T .; Родригес, А .; Stevens, R .; Wilke, A .; Wilkening, J .; Эдвардс, Р. А. (2008). «RAST-сервер метагеномики - общедоступный ресурс для автоматического филогенетического и функционального анализа метагеномов». BMC Bioinformatics. 9: 386. Дои:10.1186/1471-2105-9-386. ЧВК 2563014. PMID 18803844.
- ^ «GeneMark - Бесплатное программное обеспечение для предсказания генов». Получено 2012-03-06.
- ^ «FragGeneScan». Получено 2012-03-06.
- ^ "Проект" Микробиом Земли / Определение задач ". Архивировано из оригинал на 2012-03-16. Получено 2012-03-07.
- ^ Гилберт, Дж. А .; Дюпон, К. Л. (2011). «Микробная метагеномика: за пределами генома». Ежегодный обзор морской науки. 3: 347–371. Bibcode:2011 ОРУЖИЕ .... 3..347G. Дои:10.1146 / annurev-marine-120709-142811. PMID 21329209.