7.3. Отказоустойчивые системы
7.3.1. Системы JPL STAR и UDS. Системы JPL STAR (Self-Testing And Repairing) и UDS (Unified Data System) разработаны в Лаборатории реактивного движения JPL (Jet' Propulsion Laboratory) Калифорнийского технологического института, в которой созданы космические аппараты, исследовавшие Луну, Марс, Венеру и Меркурий, и направленные к Юпитеру и Сатурну.
Наиболее важное требование, предъявляемое к бортовой вычислительной системе космических аппаратов,— большая долговечность без обслуживания, причем на потребляемую мощность» на массу и габариты системы накладываются жесткие ограничения (как правило, 30—40 Вт, 45 кг и объем несколько тысяч кубических сантиметров). В JPL около двадцати лет проводится программа по созданию отказоустойчивых вычислительных систем в целях обеспечения требований к надежности космических аппаратов.
В период 1961—1972 гг. была выполнена первая часть программы, в результате которой, вероятно, впервые была практически построена самовосстанавливающаяся (лабораторная демонстрационная) система, получившая название JPL STAR (1969 г.). Эта система ориентирована на технологию "производства устройств для бортовых систем начала 1970-х годов (биполярные элементы с малым и средним уровнем интеграции и память на цилиндрических магнитных пленках). Всесторонняя проверка в условиям введения неисправностей в макет JPL STAR показала, что примерно при 99% всех вносимых неисправностей следовало успешное самовосстановление макета. После этой проверки система JPL STAR ^прослужила несколько лет в качестве лабораторной машины. Был разработан также бортовой вариант модели JPL STAR^ рассчитанный на 10—15 лет работы в космическом полете, но его реализация была приостановлена, так как NASA прекратило работы по подготовке полета, для которого предназначалась эта модель.
После завершения испытаний JPL STAR с 1973 г; начались работы по второй части указанной программы, которая продолжается по настоящее время. Успехи в технологии создания маломощных микропроцессоров с высокой • степенью интеграции позволили заменить относительно дорогие общие сконцентрированные вычислительные ресурсы на распределенные ресурсы, реализуемые в виде малых ЭВМ. Эти ЭВМ распределенной системы располагаются там, где они непосредственно нужны. Возникающие здесь вопросы -связаны со сложностью системы, надежностью программного обеспечения, отказоустойчивостью аппаратуры. Был построен макет подобной системы, названной UDS, который используется для эмуляции ряда функций вычислительной системы космического аппарата [3, 361J.
Структурная схема окончательного варианта системы JPL STAR'изображена на рис. 7.8 t3611. Жесткие ограничения па потребляемую мощность не позволили применить структуры с большой избыточностью, например, одновременно работающие сдвоенные или строенные системы со сравнением их сигналов или с мажоритарным голосованием на выходе соответственно. Был принят вариант, при котором должна функционировать одна ЭВМ,
имеющая развитые схемы контроля для обнаружения внутренних неисправностей. При этом затраты на обнаружение неисправностей должны быть минимальными вследствие жестких совокупных ограничений на потребляемую мощность, массу и габариты. В целях восстановления после отказа для обеспечения большой долговечности был принят вариант, когда один рабочий блок имеет несколько резервных, причем на резервные блоки питание
не подается (ненагруженный резерв). Модули замены не должны содержать слишком большое число компонентов, чтобы .интенсивность их отказов была допустимой. Поэтому, например, .центральный процессор, имевший более 1000 кристаллов, был разбит на четыре модуля (см. рис. 7.8), каждый из которых обеспечивался необходимым числом резервных модулей.
Поскольку в рабочем состоянии находится одна вычислительная машина, требуется специальное центральное устройство для непрерывной диагностики неисправностей в машине, перезапусков программ, выработки управляющих сигналов для запуска программных процедур восстановления и автоматической замены неисправных модулей на резервные путем переключения питания сразу же после обнаружения отказа какого-либо рабочего модуля. Таким устройством является процессор контроля и восстановления [361].
Система JPL STAR имеет семь типов модулей, являющихся функциональными блоками (см. рис. 7.8). Управляющий процессор модифицирует адреса команд перед их выполнением, он содержит счетчик команд и индексные регистры. Логический и основной арифметический процессоры выполняют логические и арифметические операции над словами данных соответственно. Процессор ввода-вывода управляет запросами на прерывания и содержит буферные регистры для ввода-вывода и процессор прерываний. Процессор контроля и восстановления управляет работой вычислительной машины и осуществляет диагностику и восстановление; для взаимодействия с аппаратурой восстановления • была разработана операционная система STAREX.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.