Отказоустойчивые вычислительные системы. Операции, необходимые для обеспечения отказоустойчивости вычислительной системы, страница 7

b * (C * m + d * n) = (Cn1 + Cn2 + .. + Cnt) * (2m + n).

Для некот. диагн. моделей результат х не допустим, в этом случае С = 1 и b * (C * m + d * n) = (Cn1 + Cn2 + .. + Cnt) * (m + n). Т. О.  требуется значительный объём памяти для хранения таблицы неисправностей. В процессе работы ОВС предусматривается продолжение выч. процесса после выхода из строя части модулей.

При каждом отказе выч. модуля сокращается количество вершин ДГ, след-но, изменится и его конфигурация, поэтому для обеспечения отказоустойчивой работы необходимо заготовить мн-во ДГ, соответствующих мн-ву состояний системы. Соот-но, в памяти одновременно хранятся несколько таблиц неисправностей для различных ДГ, это увеличивает объём памяти. Для ДГ с i – работающими модулями обозначим:

mi – количество проверок,

ti – мера диагностируемости при i исправных модулей,

nmax – начальное количество исправных выч. модулей,

nmin – минимально возможное количество исправных выч. модулей необходимый объём памяти:  

Для тех модулей, в которых нет состояния х, объём памяти:

Т.о. для хранения всех таблиц неисправностей требуется большой объём памяти.

Метод, основанный на теории графов

Задача определения состояния сводиться к решению известных задач на графах. При этом подзадачи, к которым сводиться грифовые методы обладают высокой трудоемкостью и не пригодны для использование в системах реального времени.

Аналитический метод

Основаны на алгебре логики. Техническое состояние системы определяется решением уравнения либо системы уравнений.

1.3.10. Использование парных элементарных проверок между машинами

Выполнение любой элементарной проверки подразумевает независимые решения фрагмента задачи wq на двух выч. модулях. Так как выч. модули имеют одинаковые характеристики, то решение любого фрагмента возможно на любой паре выч. модулей. Такой метод называется методом парных проверок, так как в любой проверки участвуют два модуля.

При таком методе проведения взаимных тестов можно заранее определить количество дополнительных ресурсов, необходимых для проведения 1го цикла диагностирования. Решение принимается по ДГ. Т.к. трудоёмкость фрагментов одинакова, то считается, что общее количество ресурсов, необх. для  проведения диагн. операций численно равно количеству решённых фрагментов задач. Т.о. общее количество ресурсов составляет: m * L = m * 2 (L = 2 – парные проверки) фрагментов задач, где  m – количество связей ДГ. Половина ресурсов используется для решение прикладной задачи, а другая выделяется дополнительно. Т.о. необходимым условием проведения всех ЭП является , кроме этого необходимым условием проведения каждой ЭП является загрузка 1го из участвующих в ней выч. модулей фрагментом прикладной задачи в качестве основного, след-но, если на каком-то такте , F() < n / 2, то все равно максимальное количество проверок, проводимых в системе будет n / 2. Т.о. исходная диаграмма загрузки должна удовлетворять след. условию: ,  - количество ЭП, проводимых в момент времени ,  = min{n - F() , F() }, если условие не выполняется, то ДЗ Р1 следует модифицировать для сокращения загрузки фрагментами прикладной задачи за счёт увеличения времени решения. Эту операцию можно сделать, распределив мн-во фрагментов прикладной задачи на 2 такта. Эта операция допустима, т.к. мн-во фрагментов, выполняемых в 1 момент времени не имеет зависимости по данным, после достижения условия производится попытка продублировать решение некот. фрагментов прикладной задачи с целью выполнения ЭП, описанных ДГ. Рассмотренное условие является необходимым, но не достаточным, т.к. это соотношение не учитывает структуру ДГ. Для построения ДЗ с учётом диагн. процедур необ-мо решить 2 задачи:

1.  Определение мн-ва ЭП, выполняемых на каждом шаге работы системы

2.  Распределение исх. данных по выч. модулям в соответствии с полученными результатами.

1.3.11. Использование коллективных диагностических проверок