Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ-инфраструктура_КонспектЛекций.doc
Скачиваний:
1278
Добавлен:
29.02.2016
Размер:
6.72 Mб
Скачать

3.3. Обслуживание высококритичных систем

Эффективная эксплуатация большой высококритичной системы предполагает не только наличие услуг расширенного технического обслуживания, но и ряд услуг, которые по праву можно отнести к услугам консалтингового характера. Однако эффективность использования всех предлагаемых услуг, в первую очередь, зависит от того, насколько точно описаны текущие требования к эксплуатации и планы развития всей IT-инфраструктуры компании.

Комплексное обслуживание высококритичных систем — вещь строго индивидуальная, поэтому в качестве примера рассмотрим компанию, требования к эксплуатации информационной системы в которой кратко можно сформулировать так:

  • центральные задачи серверного комплекса по уровню критичности можно разделить на три уровня: высококритичные и критичные задачи, обслуживающие основные бизнес-процессы компании, и низкокритичные задачи, обслуживающие вспомогательные бизнес-процессы или предназначенные для тестирования критичных задач и работы разработчиков систем;

  • режим работы всех систем серверного комплекса, обслуживающих центральные задачи — круглосуточный (24х7). Однако в зависимости от критичности решаемых ими задач требования по надежности и, в частности, допустимые времена простоя систем различны;

  • постоянное увеличение новых проектов (эксплуатируемых задач) сильно повышает сложность системы и вносит разнородные требования по эксплуатации;

  • существует потребность в периодическом тестировании различных вариантов функционирования систем (в т.ч. резервных), что в настоящий момент трудновыполнимо из-за отсутствия адекватного по производительности тестового стенда;

  • штатные специалисты, занятые обслуживанием серверного комплекса, обладают высокой квалификацией. Однако темпы роста объемов и сложность текущих задач иногда создают проблемы, связанные с недостаточностью количества штатных специалистов.

В качестве решения для повышения надежности и эффективности функционирования серверного комплекса, а также для оптимизации эксплутационных расходов в данном случае может быть предложен следующий комплекс организационно-технических мер.

Регламентные мероприятия:

А) Инвентаризация оборудования и программного обеспечения серверного комплекса.

Инвентаризация оборудования и программного обеспечения позволит создать и поддерживать актуальную карту системотехнических ресурсов, необходимую при оценке их достаточности для обеспечения требуемой надежности систем, а также для выбора оптимального пути развития информационной системы и оценки объемов необходимых инвестиций. Работы по инвентаризации включают в себя:

  • создание инвентаризационной базы оборудования, программного обеспечения, лицензий на использование программного обеспечения и базы конфигураций;

  • составление карты мест нахождения оборудования и программного обеспечения;

  • классификация и привязка прикладных задач к оборудованию;

  • создание и внедрение регламентов внесения изменений для высококритичных систем и учета их в инвентаризационной базе и базе конфигураций;

  • ежемесячное уточнение инвентаризационной базы и базы конфигураций для высококритичных систем;

  • ежегодная сверка инвентаризационной информации и базы конфигураций.

Б). Документирование систем и оптимизация конфигураций оборудования и программного обеспечения серверного комплекса

При проектировании любой развивающейся системы нельзя заранее спланировать всех особенностей ее развития. Любая большая система по мере роста будет стремиться "уйти" из оптимального состояния. Регулярный контроль изменений конфигураций оборудования и программного обеспечения, контроль текущей производительности и других параметров работы систем позволит не только своевременно определять образование "узких мест" серверного комплекса, ограничивающих его производительность и устойчивость, но и повышать надежность системы с помощью оптимизации текущих конфигураций. Работы по документированию и оптимизации включают в себя:

  • создание первоначального комплекта эксплуатационной и проектной документации на системы;

  • создание и внедрение регламентов внесения изменений в комплект эксплуатационной и проектной документации для высококритичных систем;

  • проведение модификаций комплекта эксплуатационной и проектной документации;

  • проведение первоначальной оптимизации конфигураций систем;

  • контроль и анализ параметров работы систем и при необходимости проведение дополнительных оптимизаций конфигураций.

В). Разработка, документирование и внедрение основных регламентов

Разработка, документирование и внедрение регламентов и инструкций работы штатных специалистов компании и их взаимодействия с внешними обслуживающими организациями повысит эффективность эксплуатации информационной системы, создаст отлаженный и контролируемый механизм использования человеческих ресурсов, а также обеспечит согласованное и быстрое проведение работ по восстановлению системы в аварийных ситуациях.

Г). Выполнение рутинных административных работ

Выполнение рутинных административных работ силами специалистов сервисного центра позволит эффективнее использовать высококвалифицированных штатных специалистов компании, а также компенсировать возможную нехватку штатных специалистов при росте объемов регламентированных рутинных работ. Административные работы, выполняемые специалистами сервисного центра, включают в себя:

  • ежедневное проведение регламентного мониторинга событий и текущего состояния высококритичных систем;

  • периодический контроль появления новых патчей и версий программного обеспечения, установка необходимых обновлений/патчей на высококритичные системы;

  • периодическое внесение изменений в высококритичные системы и учет соответствующих изменений в инвентаризационной базе и базе конфигураций.

Содержание обслуживания высококритичных систем представлено на рисунке 5.3.

Рисунок 5.3. Обслуживание высококритичных систем

Разовые мероприятия:

А) Построение централизованной системы мониторинга состояния системы

Создание централизованной системы мониторинга информационных ресурсов позволит автоматизировать сбор конфигурационной информации, инвентаризацию, контролировать текущее состояние системы, осуществлять оперативный мониторинг событий, а также прогнозировать загрузку системы.

Использование системы мониторинга специалистами сервисного центра позволит оперативнее осуществлять локализацию причин возникновения нештатной ситуации, а также проактивный контроль системы, снижая тем самым вероятность возникновения отказов.

Б). Помощь при планировании и проведении работ

Использование специалистов сервисного центра для проведения работ, требующих повышенного контроля работы всей информационной системы в целом и одновременного участия в работах большого количества квалифицированного персонала, позволит на краткосрочной основе задействовать необходимое количество квалифицированного персонала, а также планировать и проводить масштабные работы качественно и в срок.

Возможно использование специалистов сервисного центра для осуществления таких работ, как:

  • подготовка и проведение модернизации эксплуатируемых систем;

  • перемещение оборудования.

Плановые мероприятия:

А) Создание специального комплекса — испытательный стенд/резервный фонд

Создание специального комплекса — испытательный стенд/резервный фонд — позволит существенно снизить время простоя систем при возникновении аварийных ситуаций, оптимизировать стоимость технического обслуживания и инвестировать часть средств, выделяемых на техническое обслуживание, на материальные ресурсы — оборудование и программное обеспечение, приобретаемое в качестве стенда/резервного фонда. Назначением специального комплекса — испытательный стенд/резервный фонд — будет:

  • проверка и тестирование проектируемых решений;

  • создание и обкатка типовых конфигураций для региональных площадок;

  • моделирование, локализация и решение возникающих проблемных ситуаций при эксплуатации как центрального серверного комплекса, так и региональных комплексов;

  • временное оперативное использование компонентов стенда для замены неисправных компонентов эксплуатируемого оборудования;

  • проведение специализированных практических тренингов для штатных специалистов компании;

  • временное использование компонентов стенда для наращивания производительности эксплуатируемых систем.