Проверить МК - Check MK

Checkmk
Разработчики)tribe29 GmbH (ранее Mathias Kettner GmbH)
изначальный выпуск2008; 12 лет назад (2008)
Стабильный выпуск
1.6.0p16[1] / 19 августа 2020 г.; 3 месяца назад (2020-08-19)
Репозиторий Отредактируйте это в Викиданных
Написано вPython, C ++
Операционная системаLinux
ТипИТ-инфраструктура Мониторинг
ЛицензияGNU GPL v2 и другие Открытый исходный код лицензии, Checkmk Enterprise License[2]
Интернет сайтчекмк.com

Checkmk это программное обеспечение, разработанное в Python и C ++ для ИТ-инфраструктура мониторинг. Он используется для мониторинга серверы, Приложения, сети, облачные инфраструктуры (общественный, частный, гибридный ), контейнеры, место хранения, базы данных и окружающая среда датчики.[3]

Checkmk доступен в трех редакциях:[4] версия с открытым исходным кодом ("Checkmk Raw Edition - CRE"),[5] коммерческая версия для предприятий («Checkmk Enterprise Edition - CEE») и коммерческая версия для поставщиков управляемых услуг («Checkmk Managed Services Edition - CME»). Эти версии Checkmk доступны для ряда платформ, в частности, для различных версий Debian, Ubuntu, SLES и RedHat / CentOS, а также как Докер Образ.[6] Кроме того, предлагаются физические устройства различных размеров, а также виртуальное устройство, чтобы упростить администрирование базовых Операционная система через графический интерфейс пользователя и для включения решений высокой доступности.

Агенты, используемые Checkmk для сбора данных, доступны для 11 платформ, в том числе Windows.[7]

История

Checkmk возник в 2008 году как Агент -замещающий сценарий оболочки для Inetd, и был опубликован в апреле 2009 г. GPL.[8] Первоначально он был основан на Nagios, и расширил это с помощью ряда новых компонентов.[9][10] Версия с открытым исходным кодом (Checkmk Raw Edition) также продолжает основываться на ядре Nagios и объединяет его с дополнительными компонентами с открытым исходным кодом в целостную систему.[11]

За многие годы коммерческие версии Checkmk превратились в автономную систему мониторинга, в которой все основные компоненты Nagios были заменены собственными, включая собственное ядро ​​мониторинга.[12] Большинство разработок для коммерческих изданий, в частности все плагины, также доступны в Checkmk Raw Edition.

В прошлом Checkmk был разработан для мониторинга больших и разнородных на месте среды, начиная с версии 1.5+ (1.5p12) он также поддерживает мониторинг AWS, Лазурь, Докер и Kubernetes Сервисы.[13]

Checkmk разрабатывается tribe29 GmbH[14] в Мюнхен Германия, которая до 16.04.2019 действовала под названием Mathias Kettner GmbH. Вместе с изменением названия компании название продукта «Check_MK» также было изменено на «Checkmk».

tribe29 GmbH следует открытому ядру Бизнес модель. Выпуск с открытым исходным кодом доступен под различными лицензиями с открытым исходным кодом - в основном GPLv2, в то время как большая часть коммерческих выпусков работает под проприетарной лицензией Checkmk Enterprise.

Продукт

Checkmk сочетает в себе три типа ИТ-мониторинга:

  • Мониторинг на основе состояния, который (с помощью пороговых значений) регистрирует «состояние» устройства или приложения.
  • Мониторинг на основе показателей, который позволяет регистрировать и анализировать Временные ряды графики. Для ЦВЕ и HTML5 -система построения графиков и интеграция с Графана[15] доступны.
  • На основе журнала и мероприятие мониторинг на основе, при котором ключевые события могут быть отфильтрованы, а действия могут быть инициированы на основе этих событий.

Чтобы обеспечить очень широкий мониторинг, Checkmk в настоящее время имеет 1700+ подключаемых модулей в каждой редакции, все из которых находятся под лицензией GPLv2. Эти плагины поддерживаются как часть продукта и регулярно дополняются дополнительными плагинами или расширениями. Подключение существующих наследие Также возможны плагины Nagios.

Чтобы упростить настройку и работу, все компоненты Checkmk поставляются полностью интегрированными. Основанный на правилах 1: п настройка, а также высокая степень автоматизации значительно ускоряют рабочие процессы. Это включает в себя:

  • Автоматическое обнаружение хостов (если применимо)
  • Автообнаружение Сервисы[16]
  • Автоматическая настройка плагинов с помощью предварительно настроенных пороговых значений и правил
  • Автоматические обновления агентов (функция CEE)
  • Автоматическая и динамическая конфигурация, которая позволяет отслеживать изменчивые службы с продолжительностью жизни всего несколько секунд, например, в среде Kubernetes (начиная с CEE v1.6)[17]
  • Автоматическое обнаружение тегов и меток из таких источников, как Kubernetes, AWS и Azure (начиная с CEE v1.6)

Кроме того, существуют также руководства по использованию инструментов настройки и развертывания, таких как Ansible[18] или Поваренная соль.[19]

Checkmk часто используется в очень больших распределенных средах, где большое количество сайтов (например, 300 местоположений Faurecia[20]) и / или более 100 000 устройств (например, Edeka[21]) отслеживаются. Это возможно, в том числе, потому что микроядро Checkmk потребляет гораздо меньше ЦПУ ресурсов, чем, например, Nagios, и поэтому обеспечивает значительно более высокую производительность на том же оборудовании. Кроме того, непостоянные данные хранятся в памяти в ОЗУ что значительно улучшает время доступа.

Компоненты

Ядро мониторинга («Checkmk Microcore - CMC»)

В коммерческих редакциях Checkmk используется собственное ядро ​​мониторинга, написанное на C ++. Его производительность намного выше, чем у ядра Nagios. Кроме того, начиная с версии 1.6 он позволяет динамическую запись объектов с коротким сроком службы, таких как контейнеры. Это возможно, потому что - в отличие от ядра Nagios - Checkmk Microcore не требует перезагрузки при внесении изменений в конфигурацию. Версия с открытым исходным кодом "Checkmk Raw Edition" в настоящее время все еще использует ядро ​​Nagios.

Конфигурация и проверка двигателя

Checkmk предлагает автономное обнаружение сервисов и генерацию настроек. Checkmk использует собственный метод при выполнении чеки. В течение тестового периода каждый хозяин связывается только один раз. Результаты тестирования передаются в ядро ​​мониторинга как пассивные проверки. Это значительно улучшает производительность на сервер мониторинга, а также на контролируемых хостах.

Checkmk использует разные методы для доступа к данным в целевых системах. К ним относятся агенты, установленные в целевой системе, «специальные агенты», работающие на сервере мониторинга и взаимодействующие с API целевой системы, SNMP API для мониторинга, например, сетевых устройств и принтеров, а также HTTP /TCP протоколы для связи с веб-службами и Интернет-службами. По умолчанию Checkmk следует «принципу извлечения», то есть данные явно запрашиваются системой мониторинга, чтобы быстро определить, когда система внезапно выходит из строя и не реагирует на «извлечение». В качестве альтернативы, однако, можно настроить «push», при котором система передает свои данные напрямую в Checkmk или на промежуточный хост.

Интерфейс данных ("Livestatus")

Livestatus - это основной интерфейс в Checkmk. Он обеспечивает прямой доступ ко всем данным с контролируемых хостов и сервисов. Данные извлекаются непосредственно из ОЗУ, что позволяет избежать медленного доступа к жесткому диску и обеспечивает быстрый доступ к информации без чрезмерной перегрузки системы. Доступ осуществляется по простому протоколу и возможен со всех языки программирования не требуя специальной библиотеки.

Web-GUI («Мультисайт»)

Multisite - это веб-интерфейс Checkmk. Помимо быстрого макета страницы, он предлагает определяемые пользователем представления и информационные панели, распределенный мониторинг путем интеграции нескольких экземпляров мониторинга через Livestatus, интеграцию NagVis, интегрированный LDAP подключение, доступ к данным статуса через веб-сервисы, и многое другое. Панели мониторинга и представления можно различать для разных пользователей или групп пользователей, например vSphere -конкретный[22] представления для администраторов VMware. Веб-интерфейс в настоящее время доступен на немецком и английском языках.

Веб-администрирование («WATO»)

Инструмент веб-администрирования делает систему на основе Checkmk полностью управляемой через браузер. Сюда входит управление пользователями, ролями, группами, временными периодами и т. Д. Разрешения могут быть предоставлены детально с использованием концепции ролей. Для этого можно использовать существующие средства контроля доступа на основе ролей (LDAP, AD). WATO работает на основе правил, поэтому конфигурация остается интуитивно понятной даже в сложных средах, а необходимые усилия минимальны. Автоматическое обнаружение и настройка, а также автоматическое обновление агента еще больше ускоряют процесс настройки. HTTP API также можно использовать для интеграции CMDB для ускоренной настройки.

Система оповещения

Можно настроить несколько каналов уведомлений с разными правилами для каждого пользователя. Например, электронные письма могут быть отправлены в любое время дня, но уведомления через SMS отправляются только по важным вопросам в часы работы по вызову. Уведомления можно настроить для всех или для определенных команд, например уведомлять только администраторов хранилища о неисправном жестком диске. Повторяющиеся уведомления группируются вместе, поэтому ни один пользователь не получает дважды уведомления по определенному каналу. Кроме того, пользователи могут сами настраивать свои собственные уведомления. В распределенных средах можно централизованно управлять оповещениями. Для обнаруженных проблем действия могут запускаться автоматически (управление тревогой) с помощью скриптов. Checkmk включает интеграцию с электронной почтой и SMS-шлюзы а также к коммуникационным решениям и решениям для управления ИТ-услугами, таким как Слабина , Jira , PagerDuty , OpsGenie, VictorOps и ServiceNow.

Бизнес-аналитика

Модуль BI интегрирован в графический интерфейс пользователя. Он объединяет общее состояние бизнес-процессов, их зависимость от сложных приложений и элементов ИТ-инфраструктуры от множества отдельных хостов и служб на основе правил. Его также можно использовать для представления приложений, состоящих из микросервисов, которые, в свою очередь, состоят из модулей и развертываний Kubernetes. Кроме того, в реальном времени можно моделировать наихудшие сценарии и анализировать исторические данные, чтобы понять причины снижения производительности.

Консоль событий

Консоль событий интегрирует обработку сообщений журнала и ловушек SNMP в мониторинг. Он настраивается с помощью гибкого набора правил и решает, следует ли отбрасывать входящие сообщения или как их классифицировать. Он может подсчитывать, соотносить, ожидать сообщений, переписывать сообщения и многое другое. Подобные записи могут быть сгруппированы в одно событие (например, несколько неудачных попыток входа в систему) для отслеживания событий. Он также имеет встроенный системный журнал демон который принимает сообщения непосредственно через порт 514, и получатель ловушек SNMP, который принимает ловушки через порт 162.

Графики показателей

В коммерческих версиях Checkmk используется собственная система показателей и графиков. Это позволяет анализировать показатели временных рядов на длительных интервалах с помощью интерактивных графиков HTML5. Максимальное разрешение - одна секунда. Данные можно импортировать из различных источников данных и форматов показателей (JSON, XML, SNMP и т. Д.) И хранятся на диске устройства долговременного хранения данных.

В качестве альтернативы, Графитовый или InfluxDB можно подключить через интерфейс экспорта. Начиная с версии CEE 1.5p16, доступен плагин для интеграции данных непосредственно из Checkmk в Grafana для целей визуализации. В настоящее время Checkmk Raw Edition использует PNP4Nagios в качестве системы построения графиков.

Составление отчетов

Отчетность обеспечивает прямую доставку PDF отчеты, специальные или автоматически, через определенные промежутки времени. Он включает в себя анализ доступности, в котором история состояний за любой желаемый период времени может быть предоставлена ​​одним щелчком мыши. При расчетах доступности можно исключить неконтролируемое время, настроить разрешение или игнорировать короткие интервалы. Помимо расчетов доступности, отчеты также включают SLA отчетность, в которой можно отслеживать сложные SLA. Отчетность доступна только в коммерческих версиях Checkmk.

Инвентаризация оборудования / программного обеспечения

Инвентаризация оборудования / программного обеспечения может использоваться, например, для отслеживания изменений оборудования и программного обеспечения, для проверки наличия установленных обновлений безопасности и для обновления статических данных с помощью динамических параметров (например, обновления текущей статистики использования диска на основе данных мониторинга. ). База данных управления конфигурацией (CMDB) i-doit имеет глубокую интеграцию, которая позволяет обмениваться данными CMDB с данными мониторинга.

Смотрите также

использованная литература

  1. ^ tribe29 GmbH (19 августа 2020 г.). "Стабильная версия Checkmk 1.6.0p16". Объявление Checkmk.
  2. ^ «Checkmk EULA» (PDF). tribe29 GmbH. Получено 2019-05-31.
  3. ^ "Сценарии использования". tribe29 GmbH. Получено 2019-06-15.
  4. ^ "Checkmk Editions". tribe29 GmbH. Получено 2015-11-27.
  5. ^ «ИТ-мониторинг с открытым исходным кодом с помощью Checkmk». tribe29 GmbH. Получено 2019-07-01.
  6. ^ «Скачать версию». tribe29 GmbH. Получено 2019-07-10.
  7. ^ «Агенты мониторинга». tribe29 GmbH. Получено 2019-06-12.
  8. ^ "Матиас Кеттнер (check_mk)". Познакомьтесь с сообществом. Nagios Enterprises. 2009-08-17. Архивировано из оригинал на 2012-01-06. Получено 2015-11-27.
  9. ^ Ригер, Гётц (2012-11-03). "Einfach mal Nagios - Netzwerk-Monitoring mit OMD und Check_MK" (на немецком). не. п. 190. Получено 2015-11-27.
  10. ^ Хубер, Матиас (09.03.2011). «Nagios-Erweiterung Check_mk в версии 1.1.10» (на немецком). Журнал Linux. Получено 2015-11-27.
  11. ^ Сиринг, Питер (2017-05-31). "Мониторинг-система Check_MK в версии frischer 1.4.0" (на немецком). Heise Online. Получено 2017-05-31.
  12. ^ Кеттнер, Матиас. «Микроядро Checkmk (CMC)». Получено 2018-12-05.
  13. ^ "Объявление сообщества Checkmk 1.5 Plus (1.5.p12)". tribe29 GmbH. 2019-02-17. Получено 2019-07-11.
  14. ^ "tribe29 - Наша история". tribe29 GmbH. Получено 2019-06-14.
  15. ^ Мюллер, Кристиан (2019-04-17). "Плагин источника данных Grafana". GitHub. Получено 2019-07-09.
  16. ^ «Автоматическое обнаружение службы». tribe29 GmbH. Получено 2017-02-17.
  17. ^ «Мониторинг высокодинамичных сред». tribe29 GmbH. Получено 2019-05-07.
  18. ^ «Ansible интеграция с Checkmk». GitHub. 2019-05-01. Получено 2019-05-08.
  19. ^ «Солевая интеграция с Checkmk». GitHub. 2019-05-02. Получено 2019-05-09.
  20. ^ «Глобальное развертывание Check_MK в Faurecia». 2018-10-23. Получено 2018-10-23.
  21. ^ «ЭДЕКА Вортраг» (на немецком). 2017-05-12. Получено 2017-05-12.
  22. ^ Хайке Юрзик, Марсель Арентц (01.07.2019). "vSphere-Monitoring mit Checkmk" (на немецком). Linux-журнал. Получено 2019-07-02.

внешние ссылки