Непрерывность бизнеса и восстановление
Управление непрерывностью бизнеса (Business Continuity Management - BCM)
Стандарт/Закон | Применение в контексте BCM | Требования для РФ |
ISO 22301:2019 | Основной международный стандарт по BCM | Рекомендован, добровольное применение |
ГОСТ Р ИСО 22301-2021 | Адаптация ISO 22301 для РФ | Рекомендован для коммерческих организаций |
187-ФЗ «О безопасности КИИ» | Требования к обеспечению устойчивости объектов КИИ | ✅ Обязательно для категорированных объектов |
Приказ ФСТЭК №239 | Мониторинг и реагирование на инциденты КИИ | ✅ Обязательно, включает элементы восстановления |
Положение Банка России №757-П | Непрерывность деятельности финансовых организаций | ✅ Обязательно для кредитных организаций |
ISO 27001:2022 (A.5.29, A.5.30) | Планирование непрерывности ИБ в рамках СМИБ | Рекомендуется при сертификации |
Стандарты и фреймворки:
- ISO 22301:2019 (основной стандарт по BCM)
- ISO 27001:2022 (приложение A.5.29, A.5.30)
- NIST SP 800-34 Rev. 1 (Contingency Planning Guide)
- ГОСТ Р ИСО 22301-2021 (адаптация для РФ)
🔹 1. Основы управления непрерывностью бизнеса
УНБ – подход к обеспечению устойчивости бизнеса и его способности продолжать критически важные операции при кризисах и инцидентах
Основные элементы УНБ:
Анализ воздействия на бизнес Business Environment Analysis, BEA
Оценка рисков Risk Analysis, RA
Разработка стратегии непрерывности Business Impact Analysis, BIA
План управления инцидентами (Incident Management Plan)
Тестирование и обучение
Мониторинг и совершенствование
Отличия: BCM vs Disaster Recovery vs Incident Response
это три взаимосвязанных, но различающихся по целям, масштабу и этапам реализации подхода к управлению рисками в организации.
Критерий | Business Continuity | Disaster Recovery | Incident Response |
Основная цель | Обеспечение непрерывности бизнеса в целом | Восстановление IT-инфраструктуры и данных | Локализация и устранение угроз безопасности |
Масштаб | Все бизнес-процессы | Конкретно IT-системы и данные | Узкий, ориентирован на конкретные угрозы |
Временные рамки | Начинается с момента нарушения, продолжается до восстановления нормальной работы | Завершается при восстановлении ИТ-инфраструктуры | Активен с момента обнаружения угрозы |
• Жизненный цикл BCM (PDCA):
Политика → Анализ → Разработка → Внедрение → Тестирование → Поддержка
🎯 Результат: Понимание роли BCM в системе управления ИБ
🔹 2. Реагирование: Кризис-менеджмент
📚 Содержание:
• Что такое кризис в контексте ИБ и бизнеса
• Структура кризисного управления:
- Кризисная команда (Crisis Management Team)
- Роли: координатор, пресс-секретарь, технический лидер
• План кризисной коммуникации:
• Внутренняя: сотрудники, руководство
• Внешняя: клиенты, партнёры, регуляторы, СМИ
• Принятие решений в условиях неопределённости
• Документирование и отчётность во время кризиса
🛠️ Практика:
• Разработка матрицы эскалации инцидентов
• Шаблон кризисного коммюнике
• Ролевая игра: «Первые 24 часа после инцидента»
🎯 Результат: Навыки координации действий в кризисной ситуации
🔹 3. Восстановление: Приоритизация и BIA (Business Impact Analysis)
📚 Содержание:
• Что такое BIA и зачем он нужен
• Этапы проведения BIA:
1️⃣ Идентификация критических бизнес-процессов
2️⃣ Оценка последствий сбоя (финансовые, репутационные, регуляторные)
3️⃣ Определение зависимостей (ИТ-системы, персонал, поставщики)
4️⃣ Приоритизация процессов для восстановления
• Метрики воздействия:
• MTD (Maximum Tolerable Downtime) — максимально допустимый простой
• MAO (Maximum Acceptable Outage) — аналог MTD
• Методы сбора данных: интервью, опросы, воркшопы
• Документирование результатов: BIA Report Template
🛠️ Практика:
• Проведение мини-BIA для учебного кейса
• Построение матрицы приоритетов восстановления
• Расчёт финансовых потерь от простоя
🎯 Результат: Умение проводить BIA и определять приоритеты восстановления
🔹 4. Восстановление: Целевые показатели (СРК = RTO/RPO)
📚 Содержание:
• Ключевые метрики восстановления:
┌─────────────────────────────────┐
│ 🔹 RTO (Recovery Time Objective)│
│ Максимальное время, за которое│
│ процесс/система должна быть │
│ восстановлена после сбоя │
│ Пример: «Критичная СД должна │
│ работать не позже чем через 4ч»│
└─────────────────────────────────┘
┌─────────────────────────────────┐
│ 🔹 RPO (Recovery Point Objective)│
│ Максимальный объём данных, │
│ который допустимо потерять │
│ Пример: «Бэкапы каждые 15 мин │
│ = макс. потеря 15 мин данных» │
└─────────────────────────────────┘• Связь RTO/RPO с выбором стратегий восстановления:
• Горячий сайт (Hot Site) — минимальные RTO/RPO, высокая стоимость
• Тёплый сайт (Warm Site) — баланс стоимости и времени
• Холодный сайт (Cold Site) — долгий запуск, низкая стоимость
• Интеграция с резервным копированием и репликацией
• Документирование в плане восстановления (DRP)
🛠️ Практика:
• Расчёт RTO/RPO для различных бизнес-процессов
• Выбор стратегии восстановления под заданные метрики
• Сравнение стоимости решений при разных RTO/RPO
🎯 Результат: Умение определять и обосновывать целевые показатели восстановления
🔹 5. Тестирования и учения
📚 Содержание:
• Зачем тестировать планы непрерывности?
• Типы тестов по возрастанию сложности:
📋 Проверка документации (Checklist Test)
🔍 Настольные учения (Tabletop Exercise)
🧪 Функциональное тестирование (Component Test)
🔄 Параллельный запуск (Parallel Test)
🚨 Полномасштабные учения (Full Interruption Test)• Планирование учений:
• Определение целей и сценариев
• Выбор участников и ролей
• Разработка сценария инцидента
• Критерии успешности
• Анализ результатов и улучшение планов:
• After Action Review (AAR)
• План корректирующих действий (CAP)
• Частота тестирования: рекомендации стандартов
• Tabletop: минимум раз в год
• Full test: раз в 2-3 года или при значительных изменениях
🛠️ Практика:
• Разработка сценария для tabletop-учения
• Проведение мини-учения в учебной группе
• Составление отчёта AAR и рекомендаций
🎯 Результат: Навыки планирования и проведения тестов планов восстановления
