Пакет для короткого анализа олигонуклеотидов - Short Oligonucleotide Analysis Package

МЫЛО (Пакет для короткого анализа олигонуклеотидов) представляет собой набор биоинформатика программные инструменты от BGI Отдел биоинформатики, обеспечивающий сборку, согласование и анализ секвенирование ДНК следующего поколения данные. Он особенно подходит для данные последовательности короткого чтения.

Все программы в пакете SOAP могут использоваться бесплатно и распространяются под GPL программное обеспечение с открытым исходным кодом лицензия.

Функциональность

Набор инструментов SOAP можно использовать для выполнения следующих задач сборки генома:

Выравнивание последовательности

SOAPaligner (SOAP2) специально разработан для быстрого выравнивания коротких чтений и выгодно отличается от аналогичных инструментов выравнивания, таких как Галстук-бабочка и MAQ.[1]

Сборка генома

SOAPdenovo это короткое чтение de novo ассемблер, использующий График де Брюйна строительство. Он оптимизирован для коротких чтений, например, созданных Иллюмина и способен собирать большие геномы, такие как геном человека.[2] SOAPdenovo был использован для сборки генома гигантская панда.[3] Это было обновлено до SOAPdenovo2, г. который был оптимизирован для больших геномов и включал широко используемый модуль GapCloser.[4]

Сборка транскриптома

SOAPденово-Транс это de novo транскриптом ассемблер, разработанный специально для РНК-Seq это было создано для 1000 геномов растений проект.[5]

Indel Discovery

SOAPindel это инструмент для поиска вставки и удаления из данных секвенирования парных концов следующего поколения, предоставляя список кандидатов инделы с показателями качества.[6]

Обнаружение SNP

SOAPsnp построитель консенсусной последовательности. Этот инструмент использует вывод SOAPaligner для создания согласованной последовательности, которая позволяет SNP быть вызванным к новому последовательному человеку.

Открытие структурных изменений

SOAPsv это инструмент для поиска структурных вариаций с использованием сборки всего генома.[7]

Контроль качества и предварительная обработка

SOAPnuke это инструмент для интегрированного контроля качества и предварительной обработки наборов данных из геномных, малая РНК, Цифровая экспрессия генов, и метагеномный эксперименты.[8]

История

SOAP v1

Первый выпуск SOAP состоял только из выравнивание последовательностей инструмент SOAPaligner.[9]

SOAP v2

SOAP v2 [1] расширен и улучшен в SOAP v1 за счет значительного повышения производительности SOAPaligner инструмент. Время выравнивания было сокращено в 20-30 раз, а использование памяти - в 3 раза. Добавлена ​​поддержка сжатых форматов файлов.

Затем набор SOAP был расширен за счет включения новых инструментов: SOAPdenovo 1 & 2, SOAPindel, SOAPsnp и SOAPsv.

SOAP v3

SOAP v3 расширил средство выравнивания, став первым средством выравнивания для кратковременного чтения, использующим процессоры GPU.[10] В результате этих улучшений SOAPalign значительно превзошел конкурирующие средства выравнивания. Галстук-бабочка и BWA с точки зрения скорости.

Смотрите также

внешняя ссылка

Рекомендации

  1. ^ а б Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Ван, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для согласования краткого чтения». Биоинформатика. 25 (15): 1966–1967. Дои:10.1093 / биоинформатика / btp336. ISSN  1367-4803. PMID  19497933.
  2. ^ Li, R .; Zhu, H .; Ruan, J .; Qian, W .; Fang, X .; Ши, З .; Li, Y .; Li, S .; Shan, G .; Kristiansen, K .; Li, S .; Ян, H .; Wang, J .; Ван, Дж. (2009). «Сборка de novo человеческих геномов с массовым параллельным секвенированием короткого чтения». Геномные исследования. 20 (2): 265–272. Дои:10.1101 / гр.097261.109. ISSN  1088-9051. ЧВК  2813482. PMID  20019144.
  3. ^ Ли, Жуйцян; Фан, Вэй; Тиан, Гэн; Чжу, Хунмэй; Он, Линь; Цай, Цзин; Хуанг, Цюаньфэй; Цай, Цингл; Ли, Бо; Бай, Иньци; Чжан, Чжихэ; Чжан, Япин; Ван, Вэнь; Ли, Цзюнь; Вэй, Фувэн; Ли, Хэн; Цзянь, Мин; Ли, Цзяньвэнь; Чжан, Чжаолей; Нильсен, Расмус; Ли, Давэй; Гу, Ваньцзюнь; Ян, Чжентао; Сюань, Чжаолин; Райдер, Оливер А .; Люн, Фредерик Чи-Чинг; Чжоу, Ян; Цао, Цзяньцзюнь; Сунь, Сяо; и другие. (2009). «Последовательность и сборка de novo генома гигантской панды». Природа. 463 (7279): 311–317. Дои:10.1038 / природа08696. ISSN  0028-0836. ЧВК  3951497. PMID  20010809.
  4. ^ Ло, Руибанг; Лю, Бинхан; Се, Иньлун; Ли, Чжэньюй; Хуанг, Вэйхуа; Юань, Цзяньин; Он, Гуанчжу; Чен, Янсян; Пан, Ци; Лю, Юньцзе; Тан, Цзинбо (2012-12-01). "SOAPdenovo2: эмпирически улучшенный ассемблер для короткого чтения de novo с эффективным использованием памяти". GigaScience. 1 (1): 18. Дои:10.1186 / 2047-217X-1-18. ЧВК  3626529. PMID  23587118.
  5. ^ Се, Иньлун; У, Gengxiong; Тан, Цзинбо; Ло, Руибанг; Паттерсон, Джордан; Лю, Шанлинь; Хуанг, Вэйхуа; Он, Гуанчжу; Гу, Шэнчан; Ли, Шэнкан; Чжоу, Синь (15.06.2014). «SOAPdenovo-Trans: сборка транскриптома de novo с короткими чтениями RNA-Seq». Биоинформатика. 30 (12): 1660–1666. Дои:10.1093 / биоинформатика / btu077. ISSN  1367-4803. PMID  24532719.
  6. ^ Ли, Шэнтин; Ли, Жуйцян; Ли, Хэн; Лу, Цзяньлян; Ли, Инжруй; Болунд, Ларс; Schierup, Mikkel H .; Ван, июнь (1 января 2013 г.). «SOAPindel: эффективная идентификация вставок из коротких парных чтений». Геномные исследования. 23 (1): 195–200. Дои:10.1101 / гр.132480.111. ISSN  1088-9051. ЧВК  3530679. PMID  22972939.
  7. ^ Ли, Инжруй; Чжэн, Ханьчэн; Ло, Руибанг; Ву, Хунлун; Чжу, Хунмэй; Ли, Жуйцян; Цао, Хунчжи; Ву, Боксин; Хуанг, Шуцзя; Шао, Хаоцзин; Ма, Ханьчжоу (август 2011 г.). «Структурные вариации в двух геномах человека, картированные с разрешением одного нуклеотида путем сборки всего генома de novo». Природа Биотехнологии. 29 (8): 723–730. Дои:10.1038 / nbt.1904. ISSN  1546-1696. PMID  21785424.
  8. ^ Чен, Юсинь; Чен Юншэн; Ши, Чунмэй; Хуанг, Чжибо; Чжан, Юн; Ли, Шэнкан; Ли, Ян; Е, Цзя; Ю, Чанг; Ли, Чжо; Чжан, Сюцин (01.01.2018). «SOAPnuke: программное обеспечение с поддержкой ускорения MapReduce для интегрированного контроля качества и предварительной обработки данных высокопроизводительного секвенирования». GigaScience. 7 (1): 1–6. Дои:10.1093 / gigascience / gix120. ЧВК  5788068. PMID  29220494.
  9. ^ Li, R .; Li, Y .; Kristiansen, K .; Ван, Дж. (2008). «SOAP: короткая программа выравнивания олигонуклеотидов». Биоинформатика. 24 (5): 713–714. Дои:10.1093 / биоинформатика / btn025. ISSN  1367-4803. PMID  18227114.
  10. ^ Liu, C.-M .; Wong, T .; Wu, E .; Luo, R .; Yiu, S.-M .; Li, Y .; Ван, Б .; Yu, C .; Чу, X .; Zhao, K .; Li, R .; Лам, Т.-В. (2012). «SOAP3: сверхбыстрый инструмент параллельного выравнивания на базе графического процессора для коротких чтений». Биоинформатика. 28 (6): 878–879. Дои:10.1093 / биоинформатика / bts061. ISSN  1367-4803. PMID  22285832.