Диагностика состояния Платформы Радар
Общие данные
Диагностика состояния Платформы Радар осуществляется с помощью специального скрипта диагностики. Скрип диагностики cluster_diagnostic.sh обеспечивает проверку состояния всех сервисов и компонентов Платформы Радар. Скрипт проводит диагностику установок как на один сервер, так и распределенную (кластер).
В случае обнаружения ошибок скрипт собирает данные диагностики, относящие к данному сервису и окружению узла, на котором обнаружены ошибки работы, при этом не собирая данные с других узлов кластера или узлов, не относящихся к проблеме.
Скрипт не собирает данные диагностики, относящиеся к работе лог-коллектора, как Linux так и Windows.
Параметры командной строки скрипта
-h
- вывести список доступных параметров;--diag
- собрать данные диагностики по всем сервисам и узлам кластера Платформы Радар;--elastic-err
- выгрузить в архив ошибки парсинга. В случае использования ключа--diag
данные так же выгружаются;--export-rule
- экспортирует активные правила корреляци;--export-prometheus
- экспортирует данные диагностики в архив;--encrypted
- шифрование архива данных диагностики;--diag-data
- сбор данных диагностики с data nodes;--diag-master
- сбор данных диагностики c master node;--diag-monitoring
- сбор данных диагностики c monitoring;--diag-worker
- сбор данных диагностики c worker nodes;--diag-infra
- сбор данных диагностики c infra node;--diag-balancer
- сбор данных диагностики c balancer node;--diag-correlator
- сбор данных диагностики c correlator nodes;--diag-eventsrouter
- сбор данных диагностики c eventsrouter nodes.
Перечень сведений выгружаемых скриптом диагностики
Сервисы
- cтатус сервиса (systemctl status);
- журнал работы (journalctl);
- доступность портов.
Дополнительные журналы по сервисам (ролям):
- Data - Журналы работы узла (
/var/log/opensearch/
); - Data - Ошибки парсинга и нормализации (при использовании соответствующих параметров);
- Worker - Журналы работы и ошибки;
- Correlator - Журналы работы (без журналов работы правил корреляции);
- Веб-сервер - Журналы доступа и ошибки;
- Master (База данных) - Журналы работы и ошибки.
Сбор данных на узле с ролью master
- Доступность серверов и их IP адреса.
- Список ролей и их IP адреса.
- Контрольные суммы установленных пакетов Платформы радар.
- Параметры настройки Платформы Радар.
- Шаблоны файлов конфигурации Платформы Радар.
- SSH список известных хостов (
known_hosts
). - Состояние (размер очереди) уведомлений правил корреляции.
- Открытые ключи доступа SSH (закрытые ключи не затрагиваются).
Окружение для всех узлов
- Информация об использовании процессора.
- Информация об использовании оперативной памяти.
- Файлы конфигурации сервисов Платформы Радар.
- Файлы конфигурации системы (
/etc/
). - Журналы работы (
journalctl
). - Список активных процессов.
- Версию операционной системы.
- Журнал установки компонентов Платформы Радар.
- Список примонтированных устройств и файловой системе.
- Историю выполняемых команд.
- Журналы установки пакетов (APT, DPKG).
- Список установленных пакетов.
- Текущие маршруты (
route
). - Настройки сети.
- Доступную память.
- Информацию о дисковом пространстве и именах дисков.
- Журналы авторизации.
- Информация о настройках окружения (
env
). - Ошибки работы скрипта диагностики (в случае использования параметра --diag).
- Список подключенных репозиториев Debian (
etc/apt/sources.list
). - Настройки ядра Linux (
sysctl
). - Список запланированных задач (
Cron
).
Сбор диагностической информации при установке на один сервер
Платформа Радар позволяет выгрузить всю необходимую диагностическую информацию при установке на один сервер.
Для сбора диагностической информации необходимо выполнить команду:
/opt/pangeoradar/support_tools/diagnostics/aio_diagnostic.sh --diag
По окончанию выполнения данной команды на экран будет выведена информация об имени архива с диагностической информацией и его месторасположении.