ALL SYSTEMS OPERATIONALSLA 99.97NOC 24/7
TRIPWIRE.RU / БЛОГ
00:00:00 MSKv.26.05

Что такое SLA в ИТ-аутсорсинге и как читать его метрики

SLA — это не строчка «гарантируем 99%» в договоре, а измеримый контракт: какие метрики считаются, как фиксируются нарушения и что вы получаете, когда подрядчик не уложился. Разбираем uptime, reply time, MTTR и финансовую ответственность — на цифрах, без маркетинга.

SLA (Service Level Agreement, соглашение об уровне сервиса) — это часть договора, где зафиксировано, насколько хорошо подрядчик обязан оказывать услугу: как быстро отвечать, как быстро восстанавливать работу и что будет, если он этого не сделает. Без SLA фраза «мы обеспечиваем поддержку» не значит ничего — её нельзя проверить и нельзя предъявить.

Эта статья поможет прочитать SLA так, как его читает инженер, и отличить настоящие гарантии от маркетинговых формулировок.

// 01SLA простыми словами

Представьте, что вы покупаете не «поддержку», а измеримое обещание. SLA превращает расплывчатое «починим быстро» в конкретные числа: например, «критический инцидент берём в работу за 15 минут, восстанавливаем сервис за 4 часа, доступность системы — не ниже 99,9% в месяц». Эти числа можно измерить по логам системы мониторинга и по тикет-системе.

Хороший SLA всегда отвечает на три вопроса: что гарантируется, как это измеряется и что будет при нарушении.

// 02Ключевые метрики

МетрикаЧто означаетХороший ориентир
AvailabilityДоля времени, когда сервис доступен99,9–99,97%
Reply timeВремя до первой реакции на заявку≤ 15 мин (critical)
Resolution timeВремя до восстановления сервиса≤ 4 ч (critical)
MTTRСреднее время устранения инцидентаЧем ниже, тем лучше
Availability 99,97% ≈ не более 2,6 часов простоя в год.

Обратите внимание на разницу между reply time и resolution time. Подрядчик может за 5 минут ответить «приняли в работу» и формально выполнить SLA по реакции, но решать проблему сутки. Поэтому в договоре должны быть зафиксированы обе метрики.

// 03Приоритеты инцидентов

Не все сбои одинаковы. Зрелый SLA делит инциденты на приоритеты, и для каждого — свои сроки:

  • Critical (P1). Бизнес стоит: не работает 1С, упала касса, недоступна платёжная система. Реакция — минуты, восстановление — часы.
  • High (P2). Серьёзная деградация, но работа возможна. Реакция — десятки минут.
  • Normal (P3). Локальная проблема одного пользователя. Реакция — часы в рамках рабочего дня.
  • Low (P4). Запрос на изменение, консультация. Плановые сроки.

Если в договоре поддержки один срок «на всё» — это красный флаг: либо завышенные обязательства, которые не выполнят, либо заниженные, за которыми спрячут любую медлительность.

// 04Финансовая ответственность

SLA без последствий за нарушение — это декларация о намерениях. Настоящее соглашение содержит service credits: при недостижении показателей подрядчик возвращает часть абонентской платы. Например, падение доступности ниже порога — минус 10% от месячного платежа, грубое нарушение — больше.

Как это работает у нас

В контрактах ИТ-аутсорсинга TRIPWIRE SLA подкреплён финансовой ответственностью: если мы нарушаем согласованные показатели, вы получаете компенсацию по формуле из договора. Это дисциплинирует подрядчика лучше любых обещаний.

// 05Что проверить в договоре

  1. Указаны обе метрики времени — и реакции, и восстановления.
  2. Есть градация приоритетов инцидентов со своими сроками.
  3. Прописан способ измерения (тикет-система, мониторинг) и доступ к отчётности.
  4. Зафиксированы service credits за нарушение.
  5. Понятно, что исключается из SLA (форс-мажор, работы на стороне заказчика).
  6. Указан режим работы линии: 8×5 или 24×7.
SLA — это не приложение к договору, которое никто не читает. Это единственный документ, по которому вы сможете спросить с подрядчика за качество.

// 06Частые вопросы

Чем availability 99,9% отличается от 99,97%?

99,9% — это до 8,8 часов простоя в год, 99,97% — не более 2,6 часов. Для платёжных и торговых систем разница критична: каждый час простоя — прямые потери выручки.

Нужен ли мне SLA 24/7, если бизнес работает с 9 до 18?

Не всегда. Если ночные сбои не влияют на деньги, режим 8×5 дешевле и достаточен. Но если есть ночные регламентные операции, склад или e-commerce — нужен 24/7.

Нужна поддержка с понятным SLA?

Бесплатная 40-минутная сессия с инженером — разберём вашу ситуацию.

Обсудить проект
// Читать дальше