Сёгун (набор инструментов) - Shogun (toolbox)
Эта статья включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты.Июль 2013) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Оригинальный автор (ы) | Гуннар Рэтч Серен Зонненбург |
---|---|
Разработчики) | Серен Зонненбург Сергей Лисицын Хайко Стратманн Фернандо Иглесиас Виктор Галь |
Стабильный выпуск | 6.0.0 / 25 апреля 2017 г. |
Репозиторий | github |
Написано в | C ++ |
Операционная система | Кроссплатформенность |
Тип | Библиотека программного обеспечения |
Лицензия | BSD3 с дополнительной GNU GPLv3 |
Интернет сайт | www |
Сёгун это свободный, Открытый исходный код машинное обучение программная библиотека, написанная на C ++. Он предлагает множество алгоритмов и структур данных для машинное обучение проблемы. Он предлагает интерфейсы для Октава, Python, р, Ява, Lua, Рубин и C # с помощью SWIG.
Он лицензирован в соответствии с условиями Стандартная общественная лицензия GNU версия 3 или новее.
Описание
В центре внимания Сёгун находится на машинах ядра, таких как опорные векторные машины за регресс и классификация проблемы. Сёгун также предлагает полную реализацию Скрытые марковские модели.Ядро Сёгун написан на C ++ и предлагает интерфейсы для MATLAB, Октава, Python, р, Ява, Lua, Рубин и C #.Сёгун активно разрабатывается с 1999 года. Сегодня во всем мире существует активное сообщество пользователей, использующих Сёгун в качестве основы для исследований и образования и внесения вклада в основной пакет.
Поддерживаемые алгоритмы
В настоящее время Сёгун поддерживает следующие алгоритмы:
- Опорные векторные машины
- Алгоритмы уменьшения размерности, такие как PCA, Kernel PCA, локально линейное вложение, локально линейное вложение Гессе, выравнивание локального касательного пространства, линейное выравнивание локального касательного пространства, локально линейное вложение ядра, выравнивание локального касательного пространства ядра, многомерное масштабирование, изокарта, карты диффузии, Собственные карты лапласа
- Алгоритмы онлайн-обучения, такие как SGD-QN, Ваупал Ваббит
- Алгоритмы кластеризации: k-means и GMM
- Регрессия гребня ядра, регрессия опорных векторов
- Скрытые марковские модели
- K-Ближайшие соседи
- Линейный дискриминантный анализ
- Персептроны ядра.
Реализовано множество различных ядер, от ядер для числовых данных (таких как гауссовские или линейные ядра) до ядер для специальных данных (например, строк с определенными алфавитами). В настоящее время реализованные ядра для числовых данных включают:
- линейный
- гауссовский
- многочлен
- сигмовидные ядра
К поддерживаемым ядрам для специальных данных относятся:
- Спектр
- Взвешенная степень
- Взвешенная степень со сменами
Последняя группа ядер позволяет обрабатывать произвольные последовательности по фиксированным алфавитам, например Последовательности ДНК а также целые тексты электронной почты.
Особые возможности
В качестве Сёгун был разработан с биоинформатика с учетом приложений, он способен обрабатывать огромные наборы данных, содержащие до 10 миллионов выборок.Сёгун поддерживает использование предварительно рассчитанных ядер. Также возможно использовать комбинированное ядро, т.е. ядро, состоящее из линейной комбинации произвольных ядер в разных областях. Также можно узнать коэффициенты или веса линейной комбинации. Для этого Сёгун предлагает множественное обучение ядра функциональность.
Рекомендации
- С. Зонненбург, Г. Рэтш, С. Хеншель, К. Видмер, Дж. Бер, А. Зиен, Ф. Де Бона, А. Биндер, К. Гель и В. Франк: Набор инструментов для машинного обучения SHOGUN, Журнал исследований в области машинного обучения, 11: 1799−1802, 11 июня 2010 г.
- М. Гашлер. Waffles: набор инструментов для машинного обучения. Journal of Machine Learning Research, 12 (июль): 2383–2387, 2011 г.
- П. Винсент, Ю. Бенжио, Н. Чападос и О. Делалло. Plearn высокопроизводительная библиотека машинного обучения. URL http://plearn.berlios.de/.