Перейти к содержанию

Диагностика состояния Платформы Радар

Диагностика состояния Платформы Радар осуществляется с помощью специального скрипта диагностики. Скрип диагностики (cluster_diagnostic.sh) обеспечивает проверку состояния всех сервисов и компонентов Платформы Радар. Скрипт проводит диагностику как установок на один сервер, так и распределенную (кластер).

В случае обнаружения ошибок скрипт собирает данные диагностики, относящие к данному сервису и окружению узла, на котором обнаружены ошибки работы, при этом не собирая данные с других узлов кластера или узлов, не относящихся к проблеме.

Скрипт не собирает данные диагностики, относящиеся к работе коллектора, как Linux так и Windows.

Параметры командной строки скрипта

  • -h - вывести список доступных параметров
  • --diag - собрать данные диагностики по всем сервисам и узлам кластера Пангео Радар
  • --elastic-err - выгрузить в архив ошибки парсинга. В случае использования ключа --diag данные так же выгружаются.
  • --export-rule - экспортирует активные правила корреляции
  • --export-prometheus - экспортирует данные диагностики в архив

Перечень сведений выгружаемых скриптом диагностики

Сервисы

  • Статус сервиса (systemctl status)
  • Журнал работы (journalctl)
  • Доступность портов

Дополнительные журналы по сервисам (ролям):

  • Data - Журналы работы ноды (/var/log/elasticsearch/)
  • Data - Ошибки парсинга и нормализации (при использовании соответствующих параметров)
  • Worker - Журналы работы и ошибки
  • Correlator - Журналы работы (без журналов работы правил корреляции)
  • Веб-сервер - Журналы доступа и ошибки
  • Infra (MQ корреляции) - Журналы работы
  • Master (База данных) - Журналы работы и ошибки
  • Infra (RMCA) - Журналы доступа и ошибки

Сбор данных на узле с ролью master

  • Доступность серверов и их IP адреса
  • Список ролей и их IP адреса
  • Список подключенных источников
  • Контрольные суммы установленных пакетов Платформы радар
  • Параметры настройки Платформы Радар
  • Шаблоны файлов конфигурации Платформы Радар
  • SSH список известных хостов (known_hosts)
  • Состояние (размер очереди) уведомлений правил корреляции
  • Открытые ключи доступа SSH (закрытые ключи не затрагиваются)

Окружение для всех узлов

  • Информация о используемом процессоре
  • Информация об оперативной памяти и ее использовании
  • Файлы конфигурации сервисов Платформы Радар
  • Файлы конфигурации системы (/etc/)
  • Журналы работы (journalctl)
  • Список активных процессов
  • Версию операционной системы
  • Журнал установки компонентов Платформы Радар
  • Список примонтированных устройств и файловой системе
  • Историю выполняемых команд
  • Журналы установки пакетов (APT, DPKG)
  • Список установленных пакетов
  • Текущие маршруты (route)
  • Настройки сети
  • Доступную память
  • Информацию о дисковом пространстве и именах дисков
  • Журналы авторизации
  • Информациz о настройках окружения (env)
  • Ошибки работы скрипта диагностики (в случае использования параметра --diag)
  • Список подключенных репозиториев Debian (etc/apt/sources.list)
  • Настройки ядра Linux (sysctl)
  • Список запланированных задач (Cron)