Практики

Всего найдено: 18 практик

Создать практику

Домен

Alerting

Наблюдение/Инциденты Алертинг, Оповещения

Инструменты мониторинга создают оповещения об инцидентах, чтобы уведомить команду об изменениях, опасных действиях или сбоях в ИТ-среде. Цель ИТ-оповещений заключается в том, чтобы быстро выявлять и ...

Подробнее

Обновлено: 2026-04-30T01:43:17.387249

Audit

Наблюдение/Инциденты Альтернативное название

Audit (аудит) в ИТ используется для контроля, анализа и отслеживания активности пользователей, систем и приложений. Основной задачей является выявление аномалий, отслеживание изменений конфигурации и ...

Подробнее

Обновлено: 2026-04-30T01:43:17.561043

Capacity management

Наблюдение/Инциденты Альтернативное название

Процесс управления ресурсами ИТ-систем для обеспечения их достаточности под текущие и прогнозируемые нагрузки, оптимизации производительности и минимизации затрат.

Подробнее

Обновлено: 2026-04-30T01:43:18.833333

Cascade failure

Наблюдение/Инциденты Альтернативное название

Ситуация, когда сбой в одном компоненте системы вызывает цепную реакцию сбоев в других компонентах, приводя к масштабным отказам.

Подробнее

Обновлено: 2026-04-30T01:43:20.833169

Disaster recovery

Наблюдение/Инциденты Альтернативное название

Ситуация, когда сбой в одном компоненте системы вызывает цепную реакцию сбоев в других компонентах, приводя к масштабным отказам.

Подробнее

Обновлено: 2026-04-30T01:43:18.540853

Error budget

Наблюдение/Инциденты Альтернативное название

Допустимый лимит сбоев или недоступности системы, который балансирует потребность в стабильности и скорости внедрения новых функций.

Подробнее

Обновлено: 2026-04-30T01:43:18.788478

Health Checks

Наблюдение/Инциденты Проверка здоровья

Практика, при которой каждый сервис отдает свое состояние (работает, частично не работает, не работает) оркестратору, который производит перезапуск сервиса или выводит его из балансировки при необходи...

Подробнее

Обновлено: 2026-04-30T01:43:19.119268

Load Balancing

Наблюдение/Инциденты Балансировка нагрузки

Метод распределения входящего сетевого трафика или вычислительных задач между несколькими серверами для обеспечения высокой доступности и оптимальной производительности.

Подробнее

Обновлено: 2026-04-30T01:43:18.081079

Load Balancing

Наблюдение/Инциденты Альтернативное название

Процесс выявления и устранения корневых причин повторяющихся инцидентов для предотвращения их возникновения в будущем.

Подробнее

Обновлено: 2026-04-30T01:43:19.256298

Logging

Наблюдение/Инциденты Логирование

практика централизованного сбора и анализа логов приложения.

Подробнее

Обновлено: 2026-04-30T01:43:19.455146

Monitoring

Наблюдение/Инциденты Альтернативное название

Практика сбора и анализа системных и бизнес метрик приложения.

Подробнее

Обновлено: 2026-04-30T01:43:19.016703

Observability

Наблюдение/Инциденты Наблюдаемость

Obsevability (наблюдаемость) — это способность измерять текущее состояние системы на основе генерируемых ею данных, таких как журналы, метрики и трассировки. Observability — это показатель того, наск...

Подробнее

Обновлено: 2026-04-30T01:43:17.893733

Post-mortem

Наблюдение/Инциденты Альтернативное название

Post-mortem — это задокументированный отчет об инциденте, его последствиях, предпринятых действиях для минимизации или устранения причин, а также предотвращения повторения инцидента. Ретроспективны...

Подробнее

Обновлено: 2026-04-30T01:43:20.350853

Root cause analysis

Наблюдение/Инциденты Альтернативное название

Описание Root cause analysis

Подробнее

Обновлено: 2026-04-30T01:43:18.304316

Runbooks

Наблюдение/Инциденты Ранбуки

Документированные пошаговые процедуры, которые инженеры используют для диагностики и устранения проблем в инфраструктуре, системах и приложениях. Эти инструкции помогают стандартизировать реагирование...

Подробнее

Обновлено: 2026-04-30T01:43:19.588040

Tracing

Наблюдение/Инциденты Трассировка

Трассировка представляет собой roadmap одного запроса по всему стеку приложения. Часто используется в целях оптимизации. Библиотеки, предназначенные для упрощения трассировки, часто более сложны, чем ...

Подробнее

Обновлено: 2026-04-30T01:43:16.260448

Visualization and metrics

Наблюдение/Инциденты Альтернативное название

Визуализация бизнес и системных метрик, аналитических данных из логов, построение дашбордов.

Подробнее

Обновлено: 2026-04-30T01:43:19.922973

Дежурство

Наблюдение/Инциденты Альтернативное название

Организация дежурств сотрудников, которые круглосуточно готовы реагировать на инциденты и оперативно восстанавливать работоспособность систем. Это ключевой компонент стратегии высокой доступности и на...

Подробнее

Обновлено: 2026-04-30T01:43:17.928084