Некоторые аспекты построения кластерных систем высокой готовности. Общая схема построения кластера. Кластерная система повышенной надежности

Страницы работы

Фрагмент текста работы

Некоторые аспекты построения кластерных систем высокой готовности  

Сегодня при разработке систем специалисты в области информационных технологий сталкиваются с проблемами, которые в первую очередь относятся к обеспечению высокой надежности, доступности и управляемости разрабатываемых систем. Неадекватная производительность, долгое время реакции и остановки системы для проведения сервисного обслуживания сегодня неприемлемы. К компьютерным системам сегодня выдвигаются следующие требования:

  • Гарантировать высокий уровень готовности
  • Обеспечивать ожидаемую производительность и масштабируемость
  • Допускать интеграцию данных из различных источников
  • Способствовать повышению производительности пользователей
  • Иметь низкий показатель "цена/производительность" и низкую стоимость владения
  • Демонстрировать быструю и экономичную обслуживаемость
  • Кластерные системы высокой готовности решают перечисленные задачи.

Отказоустойчивость и высокая готовность

Необходимо различать параметры высокой готовности и отказоустойчивости. Готовность системы - это время, в течение которого система способна предоставлять сервисы своим пользователям. Показатель готовности системы - это выраженное в процентах отношение времени, когда система предоставляет сервисы своим пользователям, к общему времени работы системы. Системы высокой готовности обычно имеют показатель готовности порядка 99,999%, другими словами, время незапланированного простоя систем составляет несколько минут в год.

Отказоустойчивость аппаратной части системы предполагает такое решение по ее составу, когда сбои отдельных модулей системы не приводят к отказу всей системы в целом (коррекция ошибок, majority-voting, TRM).

Причины, которые приводят к сбою систем, могут быть разделены на следующие классы:

  • Системные сбои (аппаратное и программное обеспечение, эксплуатация)
  • Сбои прикладного ПО
  • Изменения окружающей среды
  • Функциональные сбои (конфигурация системы, функционирование и администрирование)
  • Сбои инфраструктуры (линии связи, телекоммуникации и т.д.).

Приблизительно только 45% сбоев относятся к классу системных сбоев. Остальная часть относится к сбоям ПО, окружающей среде и инфраструктуре. Следовательно, просто отказоустойчивой аппаратной части недостаточно для обеспечения высокой готовности.

Общая схема построения кластера

Кластеры могут строиться на основе различных конфигураций серверов и систем хранения данных, но есть ряд общих требований к архитектуре кластера.

Основа кластера - это некоторое избыточное количество отказоустойчивых серверов (node) от 2 до N в зависимости от конфигурации кластера и его задач.

Решение, обеспечивающее повышенную отказоустойчивость сервера, должно включать:

  • компоненты с "горячей" заменой - диски, вентиляторы, внешние накопители, устройства PCI, источники питания;
  • избыточные источники питания и вентиляторы;
  • автоматический перезапуск и восстановление системы;
  • память с коррекцией ошибок;
  • функции проверки состояния системы;
  • превентивное обнаружение и анализ неисправностей;
  • средства удаленного администрирования системы.

Системы хранения должны быть представлены RAID системами высокой готовности, которые необходимо зеркалировать для обеспечения бесперебойной работы

Похожие материалы

Информация о работе