Mlpy - Mlpy
Разработчики) | Ведущий разработчик: Давиде Альбанезе; Авторы: Джузеппе Юрман, Стефано Мерлер, Роберто Визинтайнер, Марко Кьеричи |
---|---|
Стабильный выпуск | 3.5.0 / 12 марта 2012 г. |
Написано в | Python, C и C ++ |
Операционная система | Linux, macOS, FreeBSD, Windows |
Тип | Машинное обучение |
Лицензия | GPL |
Интернет сайт | mlpy |
mlpy это Python, Открытый исходный код, машинное обучение библиотека, построенная на основе NumPy /SciPy, то Научная библиотека GNU и он широко использует Cython язык. mlpy предоставляет широкий спектр современных методов машинного обучения для контролируемых и неконтролируемых задач и направлен на поиск разумного компромисса между модульностью, ремонтопригодностью, воспроизводимостью, удобством использования и эффективностью. mlpy является мультиплатформенным, он работает с Python 2 и 3 и распространяется под GPL3.
Подходит для универсальных задач машинного обучения,[1][неудачная проверка ][2][неудачная проверка ][3][4][неудачная проверка ] Мотивирующая область применения mlpy - биоинформатика, то есть анализ высокопроизводительных омических данных.[5]
Функции
- Регрессия: наименьших квадратов, регресс гребня, наименьшая угловая регрессия, эластичная сетка, регрессия гребня ядра, опорные векторные машины (SVM), частичные наименьшие квадраты (PLS)
- Классификация: линейный дискриминантный анализ (LDA), Базовый перцептрон, Эластичная сетка, логистическая регрессия, (Ядро) машины опорных векторов (SVM), диагональный линейный дискриминантный анализ (DLDA), классификатор Голуба, на основе парзена, (ядро) дискриминантный классификатор Фишера, k-ближайший сосед, итеративное облегчение, дерево классификации, классификатор максимального правдоподобия
- Кластеризация: иерархическая кластеризация, Иерархическая кластеризация с экономией памяти, k-означает
- Снижение размерности: (Ядро) Дискриминантный анализ Фишера (FDA), Дискриминантный анализ спектральной регрессии (SRDA), (ядро) Анализ главных компонентов (PCA)
Функции ядра управляются через общий уровень ядра. В частности, пользователь может выбирать между предоставлением данных или предварительно вычисленным ядром во входном пространстве. По умолчанию доступны линейные, полиномиальные, гауссовские, экспоненциальные и сигмовидные ядра, а также могут быть определены пользовательские ядра. Многие алгоритмы классификации и регрессии снабжены внутренней процедурой ранжирования признаков: в качестве альтернативы mlpy реализует алгоритм I-Relief. Рекурсивное устранение признаков (RFE) для линейных классификаторов и алгоритм KFDA-RFE доступны для выбора функций. Методы анализа списка функций (например, индикатор стабильности Канберры)[6]), предоставляется повторная выборка данных и оценка ошибок, а также различные методы анализа кластеризации (иерархический, иерархический с сохранением памяти, k-средних). Наконец, включены выделенные подмодули для продольного анализа данных с помощью вейвлет-преобразования (непрерывное, дискретное и недецимитированное) и алгоритмов динамического программирования (динамическое искажение времени и варианты).
Смотрите также
- scikit-learn, библиотека машинного обучения с открытым исходным кодом для языка программирования Python
- Infer.NET, библиотека машинного обучения с открытым исходным кодом для .NET Framework
Рекомендации
- ^ Солеймани и др. (2011). Непрерывное обнаружение эмоций в ответ на музыкальные клипы. Международная конференция IEEE по автоматическому распознаванию лиц и жестов и семинары 2011 г.
- ^ Megies, T. и др. (2011). ObsPy - Что он может сделать для центров обработки данных и обсерваторий? Летопись геофизики, 2011.
- ^ Нгуен, М. Х (2010). Nguyen et al. Оптимальный выбор функций для опорных векторных машин. Распознавание образов, 2010.
- ^ Сантана Р. (2011) Р. Сантана. Оценка алгоритмов распределения: от доступных реализаций до потенциальных разработок. Материалы 13-й ежегодной конференции по генетическим и эволюционным вычислениям, 2011 г.
- ^ Учти С. (2010). Генные пути и подсети различают основные подтипы глиомы и проясняют потенциальную биологию, лежащую в основе. Журнал биомедицинской информатики, 2010 г.
- ^ Юрман, Джузеппе; Мерлер, Стефано; Барла, Анналиса; Паоли, Сильвано; Галеа, Антонио; Фурланелло, Чезаре (2008). «Показатели алгебраической стабильности для ранжированных списков в молекулярном профилировании». Биоинформатика. 24 (2): 258–264. Дои:10.1093 / биоинформатика / btm550. PMID 18024475. Получено 1 ноября 2013.