Анализ журнала - Log analysis

В компьютере управление журналами и интеллект, анализ журнала (или же анализ системного и сетевого журналов) - это искусство и наука, стремящиеся понять смысл компьютерных записей (также называемых журналом или контрольный журнал записи). Процесс создания таких записей называется Регистрация данных.

Типичные причины, по которым люди проводят анализ журналов:

Журналы создаются сетевыми устройствами, операционными системами, приложениями и всевозможными интеллектуальными или программируемыми устройствами. Поток сообщений во временной последовательности часто составляет журнал. Журналы могут быть направлены в файлы и сохранены на диске или направлены как сетевой поток в сборщик журналов.

Сообщения журнала обычно должны интерпретироваться с учетом внутреннего состояния их источника (например, приложения) и сообщать о связанных с безопасностью или операциями событиях (например, о входе пользователя в систему или системной ошибке).

Журналы часто создаются разработчиками программного обеспечения, чтобы помочь отладить работу приложения или понять, как пользователи взаимодействуют с системой, например поисковой системой. Синтаксис и семантика данных в сообщениях журнала обычно зависят от приложения или поставщика. Терминология также может отличаться; например, аутентификация подключения пользователя к приложению можно описать как вход в систему, вход в систему, подключение пользователя или событие аутентификации. Следовательно, анализ журнала должен интерпретировать сообщения в контексте приложения, поставщика, системы или конфигурации, чтобы проводить полезные сравнения с сообщениями из разных источников журналов.

Формат или содержание сообщения журнала не всегда могут быть полностью задокументированы. Задача аналитика журнала - побудить систему выдать полный диапазон сообщений, чтобы понять всю область, из которой сообщения должны интерпретироваться.

Аналитик журнала может сопоставить различную терминологию из разных источников журнала в единую, нормализованную терминологию, чтобы отчеты и статистику можно было получать из гетерогенной среды. Например, сообщения журнала из Windows, Unix, сетевых брандмауэров, баз данных могут быть объединены в «нормализованный» отчет для аудитора. Разные системы могут сигнализировать о разных приоритетах сообщений с помощью разного словаря, например, «ошибка» и «предупреждение» по сравнению с «ошибкой», «предупреждением» и «критическим».

Следовательно, существуют практики анализа журналов на всем протяжении от поиска текста до обратного проектирования программного обеспечения.

Функции и технологии

Распознавание образов - это функция выбора входящих сообщений и сравнения с книгой шаблонов для фильтрации или обработки по-разному.

Нормализация - это функция преобразования частей сообщения в один и тот же формат (например, общий формат даты или нормализованный IP-адрес).

Классификация и маркировка упорядочивает сообщения по разным классам или помечает их разными ключевыми словами для последующего использования (например, фильтрация или отображение).

Корреляционный анализ - это технология сбора сообщений из разных систем и поиска всех сообщений, относящихся к одному событию (например, сообщения, созданные злонамеренной деятельностью в разных системах: сетевых устройствах, межсетевых экранах, серверах и т. д.). Обычно это связано с системами оповещения.

Искусственное незнание это тип машинное обучение это процесс отбрасывания заведомо неинтересных записей журнала. Искусственное незнание - это метод обнаружения аномалий в работающей системе. При анализе журнала это означает распознавание и игнорирование обычных, общих сообщений журнала, которые возникают в результате нормальной работы системы и поэтому не слишком интересны. Однако новые сообщения, которые раньше не появлялись в журналах, могут сигнализировать о важных событиях, и поэтому их следует изучить.[1][2] Помимо аномалий, алгоритм выявляет общие события, которых не было. Например, не удалось запустить обновление системы, которое запускается каждую неделю.

Анализ журналов часто сравнивают с другими инструментами аналитики, такими как управление производительностью приложений (APM) и мониторинг ошибок. Хотя большая часть их функций явно пересекается, разница коренится в процессе. APM делает упор на производительность и чаще всего используется в производстве. Мониторинг ошибок осуществляется разработчиками, а не операторами, и интегрируется в код в Обработка исключений блоки.

Смотрите также

Рекомендации

  1. ^ «искусственное незнание: практическое руководство». www.ranum.com.
  2. ^ "Журнал классификации сообщений с помощью syslog-ng [LWN.net]". lwn.net.