Практики

Всего найдено: 18 практик

Alerting

Наблюдение/Инциденты Алертинг, Оповещения

Инструменты мониторинга создают оповещения об инцидентах, чтобы уведомить команду об изменениях, опасных действиях или сбоях в ИТ-среде. Цель ИТ-оповещений заключается в том, чтобы быстро выявлять и ...

Обновлено: 2026-04-30T01:43:17.387249
Audit

Наблюдение/Инциденты Альтернативное название

Audit (аудит) в ИТ используется для контроля, анализа и отслеживания активности пользователей, систем и приложений. Основной задачей является выявление аномалий, отслеживание изменений конфигурации и ...

Обновлено: 2026-04-30T01:43:17.561043
Capacity management

Наблюдение/Инциденты Альтернативное название

Процесс управления ресурсами ИТ-систем для обеспечения их достаточности под текущие и прогнозируемые нагрузки, оптимизации производительности и минимизации затрат.

Обновлено: 2026-04-30T01:43:18.833333
Cascade failure

Наблюдение/Инциденты Альтернативное название

Ситуация, когда сбой в одном компоненте системы вызывает цепную реакцию сбоев в других компонентах, приводя к масштабным отказам.

Обновлено: 2026-04-30T01:43:20.833169
Disaster recovery

Наблюдение/Инциденты Альтернативное название

Ситуация, когда сбой в одном компоненте системы вызывает цепную реакцию сбоев в других компонентах, приводя к масштабным отказам.

Обновлено: 2026-04-30T01:43:18.540853
Error budget

Наблюдение/Инциденты Альтернативное название

Допустимый лимит сбоев или недоступности системы, который балансирует потребность в стабильности и скорости внедрения новых функций.

Обновлено: 2026-04-30T01:43:18.788478
Health Checks

Наблюдение/Инциденты Проверка здоровья

Практика, при которой каждый сервис отдает свое состояние (работает, частично не работает, не работает) оркестратору, который производит перезапуск сервиса или выводит его из балансировки при необходи...

Обновлено: 2026-04-30T01:43:19.119268
Load Balancing

Наблюдение/Инциденты Балансировка нагрузки

Метод распределения входящего сетевого трафика или вычислительных задач между несколькими серверами для обеспечения высокой доступности и оптимальной производительности.

Обновлено: 2026-04-30T01:43:18.081079
Load Balancing

Наблюдение/Инциденты Альтернативное название

Процесс выявления и устранения корневых причин повторяющихся инцидентов для предотвращения их возникновения в будущем.

Обновлено: 2026-04-30T01:43:19.256298
Logging

Наблюдение/Инциденты Логирование

практика централизованного сбора и анализа логов приложения.

Обновлено: 2026-04-30T01:43:19.455146
Monitoring

Наблюдение/Инциденты Альтернативное название

Практика сбора и анализа системных и бизнес метрик приложения.

Обновлено: 2026-04-30T01:43:19.016703
Observability

Наблюдение/Инциденты Наблюдаемость

Obsevability (наблюдаемость) — это способность измерять текущее состояние системы на основе генерируемых ею данных, таких как журналы, метрики и трассировки. Observability — это показатель того, наск...

Обновлено: 2026-04-30T01:43:17.893733
Post-mortem

Наблюдение/Инциденты Альтернативное название

Post-mortem — это задокументированный отчет об инциденте, его последствиях, предпринятых действиях для минимизации или устранения причин, а также предотвращения повторения инцидента. Ретроспективны...

Обновлено: 2026-04-30T01:43:20.350853
Root cause analysis

Наблюдение/Инциденты Альтернативное название

Описание Root cause analysis

Обновлено: 2026-04-30T01:43:18.304316
Runbooks

Наблюдение/Инциденты Ранбуки

Документированные пошаговые процедуры, которые инженеры используют для диагностики и устранения проблем в инфраструктуре, системах и приложениях. Эти инструкции помогают стандартизировать реагирование...

Обновлено: 2026-04-30T01:43:19.588040
Tracing

Наблюдение/Инциденты Трассировка

Трассировка представляет собой roadmap одного запроса по всему стеку приложения. Часто используется в целях оптимизации. Библиотеки, предназначенные для упрощения трассировки, часто более сложны, чем ...

Обновлено: 2026-04-30T01:43:16.260448
Visualization and metrics

Наблюдение/Инциденты Альтернативное название

Визуализация бизнес и системных метрик, аналитических данных из логов, построение дашбордов.

Обновлено: 2026-04-30T01:43:19.922973
Дежурство

Наблюдение/Инциденты Альтернативное название

Организация дежурств сотрудников, которые круглосуточно готовы реагировать на инциденты и оперативно восстанавливать работоспособность систем. Это ключевой компонент стратегии высокой доступности и на...

Обновлено: 2026-04-30T01:43:17.928084