Проверить МК - Check MK
Разработчики) | tribe29 GmbH (ранее Mathias Kettner GmbH) |
---|---|
изначальный выпуск | 2008 |
Стабильный выпуск | 1.6.0p16[1] / 19 августа 2020 г. |
Репозиторий | |
Написано в | Python, C ++ |
Операционная система | Linux |
Тип | ИТ-инфраструктура Мониторинг |
Лицензия | GNU GPL v2 и другие Открытый исходный код лицензии, Checkmk Enterprise License[2] |
Интернет сайт | чекмк |
Checkmk это программное обеспечение, разработанное в Python и C ++ для ИТ-инфраструктура мониторинг. Он используется для мониторинга серверы, Приложения, сети, облачные инфраструктуры (общественный, частный, гибридный ), контейнеры, место хранения, базы данных и окружающая среда датчики.[3]
Checkmk доступен в трех редакциях:[4] версия с открытым исходным кодом ("Checkmk Raw Edition - CRE"),[5] коммерческая версия для предприятий («Checkmk Enterprise Edition - CEE») и коммерческая версия для поставщиков управляемых услуг («Checkmk Managed Services Edition - CME»). Эти версии Checkmk доступны для ряда платформ, в частности, для различных версий Debian, Ubuntu, SLES и RedHat / CentOS, а также как Докер Образ.[6] Кроме того, предлагаются физические устройства различных размеров, а также виртуальное устройство, чтобы упростить администрирование базовых Операционная система через графический интерфейс пользователя и для включения решений высокой доступности.
Агенты, используемые Checkmk для сбора данных, доступны для 11 платформ, в том числе Windows.[7]
История
Checkmk возник в 2008 году как Агент -замещающий сценарий оболочки для Inetd, и был опубликован в апреле 2009 г. GPL.[8] Первоначально он был основан на Nagios, и расширил это с помощью ряда новых компонентов.[9][10] Версия с открытым исходным кодом (Checkmk Raw Edition) также продолжает основываться на ядре Nagios и объединяет его с дополнительными компонентами с открытым исходным кодом в целостную систему.[11]
За многие годы коммерческие версии Checkmk превратились в автономную систему мониторинга, в которой все основные компоненты Nagios были заменены собственными, включая собственное ядро мониторинга.[12] Большинство разработок для коммерческих изданий, в частности все плагины, также доступны в Checkmk Raw Edition.
В прошлом Checkmk был разработан для мониторинга больших и разнородных на месте среды, начиная с версии 1.5+ (1.5p12) он также поддерживает мониторинг AWS, Лазурь, Докер и Kubernetes Сервисы.[13]
Checkmk разрабатывается tribe29 GmbH[14] в Мюнхен Германия, которая до 16.04.2019 действовала под названием Mathias Kettner GmbH. Вместе с изменением названия компании название продукта «Check_MK» также было изменено на «Checkmk».
tribe29 GmbH следует открытому ядру Бизнес модель. Выпуск с открытым исходным кодом доступен под различными лицензиями с открытым исходным кодом - в основном GPLv2, в то время как большая часть коммерческих выпусков работает под проприетарной лицензией Checkmk Enterprise.
Продукт
Checkmk сочетает в себе три типа ИТ-мониторинга:
- Мониторинг на основе состояния, который (с помощью пороговых значений) регистрирует «состояние» устройства или приложения.
- Мониторинг на основе показателей, который позволяет регистрировать и анализировать Временные ряды графики. Для ЦВЕ и HTML5 -система построения графиков и интеграция с Графана[15] доступны.
- На основе журнала и мероприятие мониторинг на основе, при котором ключевые события могут быть отфильтрованы, а действия могут быть инициированы на основе этих событий.
Чтобы обеспечить очень широкий мониторинг, Checkmk в настоящее время имеет 1700+ подключаемых модулей в каждой редакции, все из которых находятся под лицензией GPLv2. Эти плагины поддерживаются как часть продукта и регулярно дополняются дополнительными плагинами или расширениями. Подключение существующих наследие Также возможны плагины Nagios.
Чтобы упростить настройку и работу, все компоненты Checkmk поставляются полностью интегрированными. Основанный на правилах 1: п настройка, а также высокая степень автоматизации значительно ускоряют рабочие процессы. Это включает в себя:
- Автоматическое обнаружение хостов (если применимо)
- Автообнаружение Сервисы[16]
- Автоматическая настройка плагинов с помощью предварительно настроенных пороговых значений и правил
- Автоматические обновления агентов (функция CEE)
- Автоматическая и динамическая конфигурация, которая позволяет отслеживать изменчивые службы с продолжительностью жизни всего несколько секунд, например, в среде Kubernetes (начиная с CEE v1.6)[17]
- Автоматическое обнаружение тегов и меток из таких источников, как Kubernetes, AWS и Azure (начиная с CEE v1.6)
Кроме того, существуют также руководства по использованию инструментов настройки и развертывания, таких как Ansible[18] или Поваренная соль.[19]
Checkmk часто используется в очень больших распределенных средах, где большое количество сайтов (например, 300 местоположений Faurecia[20]) и / или более 100 000 устройств (например, Edeka[21]) отслеживаются. Это возможно, в том числе, потому что микроядро Checkmk потребляет гораздо меньше ЦПУ ресурсов, чем, например, Nagios, и поэтому обеспечивает значительно более высокую производительность на том же оборудовании. Кроме того, непостоянные данные хранятся в памяти в ОЗУ что значительно улучшает время доступа.
Компоненты
Ядро мониторинга («Checkmk Microcore - CMC»)
В коммерческих редакциях Checkmk используется собственное ядро мониторинга, написанное на C ++. Его производительность намного выше, чем у ядра Nagios. Кроме того, начиная с версии 1.6 он позволяет динамическую запись объектов с коротким сроком службы, таких как контейнеры. Это возможно, потому что - в отличие от ядра Nagios - Checkmk Microcore не требует перезагрузки при внесении изменений в конфигурацию. Версия с открытым исходным кодом "Checkmk Raw Edition" в настоящее время все еще использует ядро Nagios.
Конфигурация и проверка двигателя
Checkmk предлагает автономное обнаружение сервисов и генерацию настроек. Checkmk использует собственный метод при выполнении чеки. В течение тестового периода каждый хозяин связывается только один раз. Результаты тестирования передаются в ядро мониторинга как пассивные проверки. Это значительно улучшает производительность на сервер мониторинга, а также на контролируемых хостах.
Checkmk использует разные методы для доступа к данным в целевых системах. К ним относятся агенты, установленные в целевой системе, «специальные агенты», работающие на сервере мониторинга и взаимодействующие с API целевой системы, SNMP API для мониторинга, например, сетевых устройств и принтеров, а также HTTP /TCP протоколы для связи с веб-службами и Интернет-службами. По умолчанию Checkmk следует «принципу извлечения», то есть данные явно запрашиваются системой мониторинга, чтобы быстро определить, когда система внезапно выходит из строя и не реагирует на «извлечение». В качестве альтернативы, однако, можно настроить «push», при котором система передает свои данные напрямую в Checkmk или на промежуточный хост.
Интерфейс данных ("Livestatus")
Livestatus - это основной интерфейс в Checkmk. Он обеспечивает прямой доступ ко всем данным с контролируемых хостов и сервисов. Данные извлекаются непосредственно из ОЗУ, что позволяет избежать медленного доступа к жесткому диску и обеспечивает быстрый доступ к информации без чрезмерной перегрузки системы. Доступ осуществляется по простому протоколу и возможен со всех языки программирования не требуя специальной библиотеки.
Web-GUI («Мультисайт»)
Multisite - это веб-интерфейс Checkmk. Помимо быстрого макета страницы, он предлагает определяемые пользователем представления и информационные панели, распределенный мониторинг путем интеграции нескольких экземпляров мониторинга через Livestatus, интеграцию NagVis, интегрированный LDAP подключение, доступ к данным статуса через веб-сервисы, и многое другое. Панели мониторинга и представления можно различать для разных пользователей или групп пользователей, например vSphere -конкретный[22] представления для администраторов VMware. Веб-интерфейс в настоящее время доступен на немецком и английском языках.
Веб-администрирование («WATO»)
Инструмент веб-администрирования делает систему на основе Checkmk полностью управляемой через браузер. Сюда входит управление пользователями, ролями, группами, временными периодами и т. Д. Разрешения могут быть предоставлены детально с использованием концепции ролей. Для этого можно использовать существующие средства контроля доступа на основе ролей (LDAP, AD). WATO работает на основе правил, поэтому конфигурация остается интуитивно понятной даже в сложных средах, а необходимые усилия минимальны. Автоматическое обнаружение и настройка, а также автоматическое обновление агента еще больше ускоряют процесс настройки. HTTP API также можно использовать для интеграции CMDB для ускоренной настройки.
Система оповещения
Можно настроить несколько каналов уведомлений с разными правилами для каждого пользователя. Например, электронные письма могут быть отправлены в любое время дня, но уведомления через SMS отправляются только по важным вопросам в часы работы по вызову. Уведомления можно настроить для всех или для определенных команд, например уведомлять только администраторов хранилища о неисправном жестком диске. Повторяющиеся уведомления группируются вместе, поэтому ни один пользователь не получает дважды уведомления по определенному каналу. Кроме того, пользователи могут сами настраивать свои собственные уведомления. В распределенных средах можно централизованно управлять оповещениями. Для обнаруженных проблем действия могут запускаться автоматически (управление тревогой) с помощью скриптов. Checkmk включает интеграцию с электронной почтой и SMS-шлюзы а также к коммуникационным решениям и решениям для управления ИТ-услугами, таким как Слабина , Jira , PagerDuty , OpsGenie, VictorOps и ServiceNow.
Бизнес-аналитика
Модуль BI интегрирован в графический интерфейс пользователя. Он объединяет общее состояние бизнес-процессов, их зависимость от сложных приложений и элементов ИТ-инфраструктуры от множества отдельных хостов и служб на основе правил. Его также можно использовать для представления приложений, состоящих из микросервисов, которые, в свою очередь, состоят из модулей и развертываний Kubernetes. Кроме того, в реальном времени можно моделировать наихудшие сценарии и анализировать исторические данные, чтобы понять причины снижения производительности.
Консоль событий
Консоль событий интегрирует обработку сообщений журнала и ловушек SNMP в мониторинг. Он настраивается с помощью гибкого набора правил и решает, следует ли отбрасывать входящие сообщения или как их классифицировать. Он может подсчитывать, соотносить, ожидать сообщений, переписывать сообщения и многое другое. Подобные записи могут быть сгруппированы в одно событие (например, несколько неудачных попыток входа в систему) для отслеживания событий. Он также имеет встроенный системный журнал демон который принимает сообщения непосредственно через порт 514, и получатель ловушек SNMP, который принимает ловушки через порт 162.
Графики показателей
В коммерческих версиях Checkmk используется собственная система показателей и графиков. Это позволяет анализировать показатели временных рядов на длительных интервалах с помощью интерактивных графиков HTML5. Максимальное разрешение - одна секунда. Данные можно импортировать из различных источников данных и форматов показателей (JSON, XML, SNMP и т. Д.) И хранятся на диске устройства долговременного хранения данных.
В качестве альтернативы, Графитовый или InfluxDB можно подключить через интерфейс экспорта. Начиная с версии CEE 1.5p16, доступен плагин для интеграции данных непосредственно из Checkmk в Grafana для целей визуализации. В настоящее время Checkmk Raw Edition использует PNP4Nagios в качестве системы построения графиков.
Составление отчетов
Отчетность обеспечивает прямую доставку PDF отчеты, специальные или автоматически, через определенные промежутки времени. Он включает в себя анализ доступности, в котором история состояний за любой желаемый период времени может быть предоставлена одним щелчком мыши. При расчетах доступности можно исключить неконтролируемое время, настроить разрешение или игнорировать короткие интервалы. Помимо расчетов доступности, отчеты также включают SLA отчетность, в которой можно отслеживать сложные SLA. Отчетность доступна только в коммерческих версиях Checkmk.
Инвентаризация оборудования / программного обеспечения
Инвентаризация оборудования / программного обеспечения может использоваться, например, для отслеживания изменений оборудования и программного обеспечения, для проверки наличия установленных обновлений безопасности и для обновления статических данных с помощью динамических параметров (например, обновления текущей статистики использования диска на основе данных мониторинга. ). База данных управления конфигурацией (CMDB) i-doit имеет глубокую интеграцию, которая позволяет обмениваться данными CMDB с данными мониторинга.
Смотрите также
использованная литература
- ^ tribe29 GmbH (19 августа 2020 г.). "Стабильная версия Checkmk 1.6.0p16". Объявление Checkmk.
- ^ «Checkmk EULA» (PDF). tribe29 GmbH. Получено 2019-05-31.
- ^ "Сценарии использования". tribe29 GmbH. Получено 2019-06-15.
- ^ "Checkmk Editions". tribe29 GmbH. Получено 2015-11-27.
- ^ «ИТ-мониторинг с открытым исходным кодом с помощью Checkmk». tribe29 GmbH. Получено 2019-07-01.
- ^ «Скачать версию». tribe29 GmbH. Получено 2019-07-10.
- ^ «Агенты мониторинга». tribe29 GmbH. Получено 2019-06-12.
- ^ "Матиас Кеттнер (check_mk)". Познакомьтесь с сообществом. Nagios Enterprises. 2009-08-17. Архивировано из оригинал на 2012-01-06. Получено 2015-11-27.
- ^ Ригер, Гётц (2012-11-03). "Einfach mal Nagios - Netzwerk-Monitoring mit OMD und Check_MK" (на немецком). не. п. 190. Получено 2015-11-27.
- ^ Хубер, Матиас (09.03.2011). «Nagios-Erweiterung Check_mk в версии 1.1.10» (на немецком). Журнал Linux. Получено 2015-11-27.
- ^ Сиринг, Питер (2017-05-31). "Мониторинг-система Check_MK в версии frischer 1.4.0" (на немецком). Heise Online. Получено 2017-05-31.
- ^ Кеттнер, Матиас. «Микроядро Checkmk (CMC)». Получено 2018-12-05.
- ^ "Объявление сообщества Checkmk 1.5 Plus (1.5.p12)". tribe29 GmbH. 2019-02-17. Получено 2019-07-11.
- ^ "tribe29 - Наша история". tribe29 GmbH. Получено 2019-06-14.
- ^ Мюллер, Кристиан (2019-04-17). "Плагин источника данных Grafana". GitHub. Получено 2019-07-09.
- ^ «Автоматическое обнаружение службы». tribe29 GmbH. Получено 2017-02-17.
- ^ «Мониторинг высокодинамичных сред». tribe29 GmbH. Получено 2019-05-07.
- ^ «Ansible интеграция с Checkmk». GitHub. 2019-05-01. Получено 2019-05-08.
- ^ «Солевая интеграция с Checkmk». GitHub. 2019-05-02. Получено 2019-05-09.
- ^ «Глобальное развертывание Check_MK в Faurecia». 2018-10-23. Получено 2018-10-23.
- ^ «ЭДЕКА Вортраг» (на немецком). 2017-05-12. Получено 2017-05-12.
- ^ Хайке Юрзик, Марсель Арентц (01.07.2019). "vSphere-Monitoring mit Checkmk" (на немецком). Linux-журнал. Получено 2019-07-02.
внешние ссылки
- Официальный веб-сайт
- Компьютерный мониторинг с помощью Open Monitoring Distribution (Кельвин Вандерлип, 01.03.2012)
- Использование Open Monitoring Distribution (Nagios) для мониторинга сложных аппаратных / программных систем (Джо ВанАндель, 29 марта 2012 г.)