Отказоустойчивые вычислительные системы. Операции, необходимые для обеспечения отказоустойчивости вычислительной системы, страница 6

f4- оба неисправны.

При этом предполагается что элементарные проверки обладают свойством полноты, то есть исправный контролирующий модуль всегда верно определяет состояние контролируемого.

f1 = 0 - соответствует исправному состоянию.

f2 = 1 – соответствует неисправному состоянию.

Соответственно f3,f4 могут принимать значения {0,1,x}

х – горит о том, что состояние неопределенно, следовательно значение непредсказуемо.

Примеры

1.    0110,

0111,

011х.

Данные модели можно назвать симметричными, так как в рамках этих моделей элементарные проверки не зависят от того, какой модуль является контролирующий , а какой контролируемый.

Остальные 6 моделей являются несимметричными:

2. система STRATUS. В ней предполагается, что два сложных устройства не могут одновременно выйти из строя.  Поэтому совпадение результатов интерпретируется как исправность обоих выч. модулей. В противном случае один из модулей, либо оба считаются вышедшими из строя. Соответственно модель буде выглядит 0111.

3.   В ряде случае возможно совпадение результатов решения как при работоспособности обоих модулей, так и при их одновременном выходе из строя.

Если результатом работы неисправного блока, является константа 0 или константа 1. В этом случае диагностическая модель 0110

4. В силу особенности конкретной реализации, неисправность может проявиться только при   решении определенного класса задач. В этом случае при проведении элементарных проверок методом парного решения, для части фрагментов результаты совпадут, а для части нет. То есть можно сказать что элементарный проверки, проводящиеся неисправным модулем непредсказуемы. В этом случае диагностическая модель 01хх.

5. Если в систем возможен только один класс неисправностей, при чем результаты решения двумя неисправными модулями одного и тог   же фрагмента совпадут, то можно говорить о модели 01х0.

6.  Так как выч. модуль представляет собой сложное устройство и результаты неисправных модулей зависят от неисправностей, которых может быть достаточно много, то вероятность принятия одного и того же решения двумя неисправными модулями мала. В этом случае можно использовать диагностическую модель 01х1.

1.3.9. Методы дешифрации синдрома системы

Дешифрация синдрома – определение технического состояния системы по фактически полученному синдрому. Методы дешифрации синдрома можно разделить на три группы:

1.  табличные методы.

2.  методы, основанный на теории графов

3.  аналитические методы

Табличный метод

Заблаговременно, возможно на этапе проектирования ВС составляется таблица потенциальных синдромов для всевозможных отказовых ситуациях, с количеством неисправных модулей от 0 до t Данная таблица содержит два поля:

1.  синдром

2.  состояние

Для определения состояния системы достаточно найти строку, в которой значения поля «синдром» соответствует полученному синдрому и взять значения поля «состояния», то есть мы провели цикл диагностирования.

Синдром представляет собой строку S = {S1,S2,....Sm}. для ускорения поиска строки, соответствующей синдрому, таблица неисправности упорядочивается по полю «синдром».Поле синдром уникально для каждого состояния.

Преимущества:

- простая реализация

- не высокая трудоемкость

- однозначность результата.

Недостатки:

необходимость построения таблицы неисправности для каждого диагностического графа.

Оценка объёма памяти:

Для t-диагност. Системы количество строк в таблице неисправностей равно b = Cn0 + Cn1 + .. + Cnt,   Cnk = n! / (k!*(n-k)!),  0,1,t – количество неисправных модулей

Для любой диагност. Модели синдром полностью исправной системы состоит полностью из 0-вых элементов, след-но, строку, состоящую их 0-вых элементов в поле синдрома, можно исключить из таблицы. Количество строк получится   b = Cn1 + .. + Cnt. Результат каждой элементарной проверки в общем случае может принимать 3 значения: 0,1,х. Соот-но для хранения результата требуется С  = 2 бита. Каждый выч. модуль может находиться в одном их двух состояний: исправное, неисправное. Для хранения состояния потребуется d = 1 бит. Т.о. для хранения таблицы неисправностей требуется  b * (C * m + d * n) количество бит (m – количество элем. проверок).