Monitoring

Наблюдение/Инциденты monitoring
Описание

Практика сбора и анализа системных и бизнес метрик приложения.

Ценность
Преимущества:
  • Позволяет оценить текущее состояние приложения и тренды. Позволяет собрать данные для последующего анализа и улучшения процессов и приложения.
  • Команда может отследить по метрикам как работает приложение на разных окружениях, справляется ли оно с нагрузкой. На основе системных метрик можно планировать расширение инфраструктурных ресурсов, готовиться к маркетинговым компаниям и росту пользователей.
  • Бизнес метрики позволят выяснить каким функционалом действительно пользуются клиенты, позволяют проверяют бизнес гипотезы. Позволяют планировать развитие приложения и вырезать лишний и неиспользуемый функционал, сокращая затраты на поддержку ненужного кода.
  • Настроенные нотификации предупредят об инциденте до того, как пользователи заметят деградацию сервиса. Что позволит быстрее исправить проблему.
Последствия отсутствия:
  • Нет информации о том, работает ли приложение и как оно работает. Невозможно оценить качество предоставляемого сервиса, количество пользователей, сколько прибыли генерирует приложение и сколько ресурсов оно в действительности потребляет.
  • Информация о проблемах приходит от пользователей. Нет инструментов для поиска причин сбоев.
  • Затраты на устранение инцидентов значительно возрастают.
Критерии оценки 21
SURVEY

Команда разработки может получить метрики со всех окружений

Варианты по умолчанию: Да / Нет / Частично
SURVEY

Команда разработки может получить готовый настроенный мониторинг со всеми необходимыми метриками и их высокой детализацией

Варианты по умолчанию: Да / Нет / Частично
SURVEY

Метрики собираются осмысленно и предоставляют полезную информацию для анализа и принятия решений

Варианты по умолчанию: Да / Нет / Частично
CHECK

Команда разработки может получить метрики со всех окружений.

CHECK

Модуль Deckhouse Prometheus/Grafana. Команда разработки может получить все инфраструктурные метрики Deckhouse и его компонентов с возможностью отправки оповещений во внешние системы.

CHECK

Модуль Deckhouse OKmeter. Команда разработки может получить готовый настроенный мониторинг со всеми необходимыми метриками и высокой их детализацией.

CHECK

Establish Clear Monitoring Objectives (KPIs) 1.1. Key Performance Indicators (KPIs) 1.2. Monitoring Goals Alignment - monitoring objectives match the main goals of continuous monitoring 1.3. Metrics Tracking - Track the right metrics to meet your objectives. 1.4. Issue Detection - Clear objectives help teams find potential problems before they become big ones.

CHECK

Implement Comprehensive Infrastructure Monitoring 2.1. Key Performance Indicators (KPIs) - Focus on these main KPIs for infrastructure monitoring. 2.2. Other Important Metrics - определить ключевые метрики 2.3. Catching Problems Early

CHECK

Prioritize Application Performance Monitoring (APM).

CHECK

Use Log Management and Analysis.

CHECK

Adopt Automated Alerting and Incident Response.

CHECK

Integrate Security Monitoring

CHECK

Use AI and Machine Learning for Smart Monitoring

CHECK

Set clear goals. Helps focus on what's important

CHECK

Watch everything. Keeps an eye on all parts of the system

CHECK

Check how apps work. Makes sure apps run smoothly

CHECK

Look at logs. Helps find and fix issues

CHECK

Use automatic alerts. Tells teams about problems quickly

CHECK

Watch for security issues. Keeps systems safe

CHECK

Use AI to help. Finds problems before they happen

CHECK -1

метрики формально собираются, но не несут никакой полезной информации.

Ресурсы 3
  • Модуль Deckhouse Prometheus/Grafana предназначен для получения всех инфраструктурных метрик Deckhouse и его компонентов с возможностью отправки оповещений во внешние системы [URL - https://deckhouse.ru/products/kubernetes-platform/documentation/v1.67/modules/prometheus/]
  • Модуль Deckhouse ingress-nginx предназначен для мониторинга и сбора статистики с Ingress контроллера [URL - https://deckhouse.ru/products/kubernetes-platform/documentation/v1.67/modules/ingress-nginx/]
  • Модуль Deckhouse cert-manager предназначен для мониторинга срока действия SSL сертификатов и корректности их перевыпуска.
Метаданные
ID:
e2ded8bf-d6df-4cc4-8d97-ece3bba99b14
Slug:
monitoring
Версия:
2.0
Проекты:
ФармаИмпекс Pravo(tech) Naumen
Критерии:
3 survey 18 check
Создано:
2026-04-30
Обновлено:
2026-04-30