Отказоустойчивые вычислительные системы. Операции, необходимые для обеспечения отказоустойчивости вычислительной системы, страница 8

Рассмотрим случай одинаковой трудоемкости фрагментов задач, но проводятся не парные проверки, а коллективные. Необходимым условиям для проведения коллективных проверок является наличие хотя бы одного выч. модуля, не занятого решением прикладной задачи. По результатам коллективной проверки можно произвести

      сравнений независимо получаемых результатов, решения одного и того же фрагмента задач.

r – количество выч. модулей, задействованных  операциях.

F() – функция плотности загрузки.

На графике показана зависимость количества вычислительных модулей, задействованных в диагностических операциях от F().

r

 


n

 


0

1          n          F()

Следующий график показывает зависимость количества эквивалентных парных элементарных проверок от F().

Nэкв.

  n(n-1)

2

 


1    x        n        F() х – количество модулей, занятых решением задачи

n = r + x

Для построения плана решения прикладной задачи с использованием диагностических процедур в случае коллективных проверок, требуются те же этапы, что и в случае парных проверок. А именно построение диаграммы p1,p2  и затем p3.

1.3.12 Состояния отказоустойчивых вычислительных систем

Так как отказоустойчивая вычислительные системы обладают способностью постепенной деградации, она может находиться в  трех состояниях:

1.  отказоустойчивое

2.  не отказоустойчивое, но работоспособное

3.  неработоспособное

Отличие 2го от 3го: не отказоустойчивое состояние не видно для пользователя. Когда система находится во 2м состоянии, срабатывает оповещение.

Живучая ВС – это отказоустойчивая ВС, в которой реализовано использование всех доступных исправных ресурсов.

1.3.13 Принципы организации самодиагностики

Процесс диагностирования ВС может быть реализован как самодиагностирование, то есть объект диагностирования сам определяет свое состояние и находит неисправные компоненты.

Самодиагностирование может быть основано на двух принципах:

3.  принцип расширяющихся областей

4.  принцип распределенного ядра

В первом случае в системе выделяется конкретная заведомо работоспособная часть, называется сосредоточенным ядром, и обладающая возможностью диагностировать некоторую другую часть системы.

На следующих этапах диагностирования в качестве среды диагностирования выступает ядро и уже проверенная часть системы.

Недостатки: неисправность ядра делает невозможность проведения диагностирования.

В ряде случаев ядро реализуется внешними, по отношению к системе, средствами.

В системах использующие принцип распределенного ядра, нет необходимости выделять заведомо исправную часть Вычислительные модули проводят взаимные проверки и делают предположения о исправности либо неисправности соседних модулей. Результат о исправности или неисправности любого модуля входящего в систему может быть получен только после проведения всего комплекса проверок.

1.3.14 Планирование загрузки элементарных машин с учётом операций диагностирования

Для отказоустойчивого решения задач необходимо получить диаграмму загрузки с учётом ДГ и предусмотреть в ней выполнение диагн. операций. Получение такой ДЗ можно разбить на 3 этапа. На 1м этапе мы получаем ДЗ Р1. Критерием построения такой диаграммы является минимизации времени решения Тцр min. На 2м этапе мы получаем вспомогательную ДЗ, которую можно обозначить Р2, критерием построения её является минимизация количества выч. модулей, задействованных в решении прикладной задачи при заданном максимальном времени решении Тцрmax = сonst. ДЗ Р2 получает преобразованием Р1. Необходимо увеличить количество свободных модулей, ri max. На 3м шаге получаем ДЗ Р3, которая учитывает выполнение диагностических операций согласно ДГ.

Максимальное количество ЭП, выполняемых в системе одновременно, не превышает целой части от половины количества выч. модулей, след-но, при построении ДЗ Р2 уменьшение количества модулей, занятых решением прикладной задачи меньше, чем половина выч. модулей не имеет смысла, т.к. при этом сокращается количество ЭП. Зависимость количества ЭП от функции плотности загрузки.