Архитектурные, программные и технические средства обеспечения надежности настолько тесно связаны между собой, что распределить их по отдельным разделам не представляется возможным. Также не представляется возможным дать сколько-нибудь полный перечень этих средств. В данном разделе рассматриваются типичные средства, применяемые практически во всех системах высокой готовности {см. ниже}.
Первоочередной задачей обеспечения надежности является, естественно, обеспечение готовности данных, которая обычно достигается за счет реализации системы резервного копирования {архитектурные решения} и/или организацией зеркалирования дисковых массивов {архитектурно – техническое решение}. Данные при этом понимаются в широком смысле и включают в себя не только массивы информации, но и прикладное программное обеспечение, сервисы ОС, исполняемые коды и т. д. При такой трактовке готовность данных означает также и готовность подсистем и сервисов.
Непредсказуемость вида, места и времени проявления дефектов ИС в процессе эксплуатации приводит к необходимости создания специальных, дополнительных систем оперативной защиты (СОЗ) от искажений вычислительного процесса, программ и данных, которые включают в себя системы оперативного контроля (СОК) функциональных процессов {архитектурное решение}. Назначение СОЗ - автоматическое выявление перечисленных дефектов, блокирования их последствий до выявления и устранения их первичных источников. Общая архитектура СОЗ/СОК приведена на рис. 4.
Для повышения устойчивости ИС используют специальные методы автоматического сокращения длительности восстановления и преобразования отказов в кратковременные сбои путем введения в программные средства временной, программной и информационной избыточности {архитектурно – программно – техническое решение}.
Замечание. Временная избыточность – запас производительности аппаратных средств, необходимый для работы программных средств обеспечения надежности.
Избыточность часто сочетается с кластерной архитектурой ИС.
Важное значение имеют также эффективность средств контроля данных, поступающих из внешней среды {архитектурные и программные решения}. В реальных условиях по различным причинам исходные данные могут попадать в области значений, не проверенные при испытаниях, а также не заданные требованиями спецификаций и технического задания, вызывающие сбои и отказы. При этом сама ИС может функционировать абсолютно надежно.
Рис. 4. Архитектура систем оперативной защиты (СОЗ) и оперативного контроля (СОК)
Игнорирование искажения - игнорирование обнаруженного искажения функционального процесса вследствие его слабого влияния на процесс функционирования в целом и на выходные результаты.
Исключение сообщения из обработки выполняется вследствие его искажения или трудности предстоящего восстановления функционального процесса.
Восстановление прерываний – повторение функциональной группы приложений при тех же исходных данных или кратковременное прекращение решения задач данной группы до обновления исходных данных.
Изменение режима работы или структуры ИС выполняется для снижения влияния перегрузки или в связи с потерей информации о ходе процесса обработки данных и управления.
Изменение конфигурации системы – как правило, это означает переход на резервную ЭВМ с накопленной информацией о ходе процесса управления или восстановление информации за счет ее дублирования.
Средства обеспечения доступности данных в системах высокой готовности опираются на аппаратную избыточность и информационную избыточность (избыточность данных).
Аппаратная избыточность может включать (при высоких требованиях к надежности) платформы с полным резервированием, поддерживающие (standby) процессоры, диски с двойным интерфейсом (dual-port) и дисковые массивы (RAID).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.