Health Checks

Наблюдение/Инциденты health-checks
Текущая практика
Зависит от неё
Описание

Практика, при которой каждый сервис отдает свое состояние (работает, частично не работает, не работает) оркестратору, который производит перезапуск сервиса или выводит его из балансировки при необходимости.

Ценность
Преимущества:
  • Простой способ получить статус и метрики приложения позволит быстро оценить состояние системы. В дальнейшем, сбор метрик можно подключить к системе мониторинга.
  • Команда может быстро узнать состояние приложения.
  • Большинство систем мониторинга умеют обрабатывать такие страницы состояния и собирать с них метрики. При этом метрики со страницы статуса определяются автоматически. Подключение к системе мониторинга будет значительно проще.
  • Есть возможность включать сервис в балансировку только после его успешного запуска.
  • Отсутствуют “зомби”-сервисы — сервисы, которые не работают из-за критической ошибки, но при этом запущены и потребляют ресурсы.
Последствия отсутствия:
  • Затруднен ручной поиск неработающих сервисов с учетом логов.
  • Метрики и состояние будут доступны только через систему мониторинга, если она настроена.
  • Чтобы добавить новую метрику придется дополнительно настраивать систему мониторинга.
  • Увеличение количества клиентских ошибок из-за необходимости ручного перезапуска сервисов на стенде при наличии ошибок.
Критерии оценки 5
SURVEY

Статус на странице проверки здоровья всегда соответствует статусу приложения

Варианты по умолчанию: Да / Нет / Частично
SURVEY

Если приложение не работает, страница статуса возвращает HTTP-код ошибки

Варианты по умолчанию: Да / Нет / Частично
SURVEY

Есть способ для проверки состояния приложения (обычно, отдельный эндпоинт)

Варианты по умолчанию: Да / Нет / Частично
CHECK

Статус на странице соответствует статусу приложения

CHECK

При нерабочем состоянии приложения, при обращении к странице статуса возвращается HTTP код, сообщающий об ошибке

Ресурсы 3
  • docs.spring.io
    https://docs.spring.io/spring-boot/docs/current/reference/html/actuator.html#actuator.endpoints.kubernetes-probes
  • kubernetes.io
    https://kubernetes.io/ru/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/
  • docs.nginx.com
    https://docs.nginx.com/nginx/admin-guide/load-balancer/tcp-health-check/
Метаданные
ID:
3ad4be8c-fbe5-44c3-9ed4-3093b833e014
Slug:
health-checks
Версия:
2.0
Проекты:
ФармаИмпекс Client1/Project1
Критерии:
3 survey 2 check
Создано:
2026-04-30
Обновлено:
2026-04-30