
Лекция 14 - SLA - Принципы контроля и мониторинга оборудования
.pdfПринципы построения системы контроля и мониторинга оборудования
Соглашение об уровне обслуживания - Service Level Agreement, SLA
•SLA – это основной документ, регламентирующий взаимоотношения ИТ-сервиса и клиентов, определяет взаимные ответственности провайдера ИТ-сервиса и пользователей этого сервиса.
•Цель документа – дать качественное и количественное описание сервисов, как с точки зрения провайдера, так и сточки зрения клиента.
•SLA заключается между поставщиком ИТ-услуг и заказчиком (по умолчанию – между ИТ-подразделением и основным бизнесом компании).

Модель SLA
• В SLA фиксируются условия
|
сервисы |
|
оказания услуг, |
|
|
упорядочиваются |
|
|
|
|
|
|
|
|
взаимоотношения с |
|
|
|
пользователями. |
|
SLA |
|
• SLA – это управление |
клиенты |
качество |
ожиданиями пользователей. |
|
|
|
|
Качественным может быть |
|
|
|
только такое обслуживание, |
|
|
|
когда каждый, кто подает |
|
сроки |
|
заявку, знает срок исполнения |
|
|
заявки. |
|
|
|
|
Структура SLA
•Описание сервисов/услуг, предоставляемых в рамках SLA (часть или весь каталог сервисов, предоставляемых ИТслужбой).
•Описание условий предоставления сервисов / услуг (вплоть до порядка обработки запросов на определенные услуги).
•Формальные параметры качества предоставляемых сервисов/услуг (время устранения инцидентов; время простоя сервиса целиком и т.п.) и их целевые показатели. Эти параметры качества должны соответствовать бизнесцелям и отражать потребности пользователей в способах оказания услуг.
Классы сервисов
Класс 0 – Сервисы, критические для работы большинства пользователей. К ним относятся коммуникационная инфраструктура, проблемы с сервисами этого класса приводят к невозможности взаимодействия.
Класс 1 – Сервисы, критические для работы групп пользователей. К ним относятся все заказные сервисы и подписные, за исключением интернета и электронной почты. Проблемы с сервисами этого класса приводят к невозможности выполнения специальных задач пользователем.
Класс 2 – Сервисы, критические для работы одного пользователя. К ним относятся все базовые сервисы за исключением коммуникационной инфраструктуры, а так же интернет и электронная почта. Проблемы с сервисами этого класса влияют на работу одного пользователя.
Показатели уровней качества сервиса
•доступность сервиса – число сбоев в период обслуживания
•средняя длительность сбоя сервиса – длительность времени, в течение которого он недоступен потребителю
•время отклика сервиса – время ожидания, прошедшее после вызова сервиса
•текущая пропускная способность – пропускная способность канала, оцененная в данный момент. Используется для сравнения со средней пропускной способностью

Целевые уровни качества сервиса
Уровни качества |
Класс 0 |
|
Класс 1 |
|
Класс 2 |
|
|
|
|
|
|
|
|
доступность |
Не более 1 |
в год |
Не более 2 |
в год |
Не более 3 |
в год |
|
|
|
|
|
|
|
средняя |
Не более 1 |
часа |
Не более 3 |
часов |
Не более 5 |
часов |
длительность сбоя |
|
|
|
|
|
|
|
|
|
|
|
||
время отклика |
Не заметно |
|
< 1 секунды. |
< 2 секунд. |
||
|
пользователю |
Заметно, но не |
Заметно, но |
|||
|
|
|
мешает работе |
пользователь |
||
|
|
|
|
|
может продолжать |
|
|
|
|
|
|
работу |
|
|
|
|
|
|
|
|
Установка приоритетов и классов заявок
•Уровень 5 (наивысший) – Проблема затрагивает большую часть пользователей или vip-пользователей.
•Уровень 4 (высокий) – Проблема, затрагивающая группу пользователей.
•Уровень 3 (средний) – Проблема, затрагивающая одного пользователя.
•Уровень 2 (низкий) – Проблема, возникающая у пользователей временно.
•Уровень 1 (минимальный) – Проблема, возникшая единовременно.

Уровни срочности решения инцидента
•Введение четко регламентированного времени реакции для устранения инцидента/предоставления услуги является частью процесса SLM (Service Level Management).
|
Наивысший |
Высокий |
Средний |
Низкий |
Минимальный |
|
|
уровень |
уровень |
уровень |
уровень |
уровень |
|
|
срочности |
срочности |
срочности |
срочности |
срочности |
|
|
|
|
|
|
|
|
Время, |
|
|
|
|
|
|
выделенное |
|
|
1 рабочий |
5 рабочих |
10 рабочих |
|
на решение |
4 часа |
8 часов |
||||
|
|
|
||||
инцидента |
день |
дней |
дней |
|||
|
|
|||||
|
|
|
|
|
|

ПРИМЕР:
http://www.zabbix.com
Cистема мониторинга и отслеживания статусов сервисов компьютерных сетей.
//относится к свободному ПО