Вычислительная система космического корабля «Шаттл», страница 3

Анализ аппаратного и программного способов внесения избы­точности в целях устойчивости к отказам вычислительных систем выполнен в [528]. Выделяются три метода внесения избыточно­сти: аппаратный, программный и временной. При этом первый подразделяется на метод статического внесения избыточности (например, тройное резервирование с голосованием) и метод ди­намического внесения избыточности (резервирование с «холод­ным» и «горячим» резервом и с идентификацией отказа). Про­граммная избыточность предполагает наличие дополнительного программного кода, а временная избыточность предполагает по­вторение операций, в -которых были обнаружены ошибки, путем перезапуска программ от контрольных точек. Анализ отказоус­тойчивости выполнен в обзоре [1198]. Прикладные аспекты тео­рии отказоустойчивых вычислительных систем (анализ, проекти­рование и моделирование) изложены в, [111-1]. Краткий библио­графический обзор аппаратного и программного обеспечения высокой надежности применительно к стоуктупам параллельных вычислительных систем содержится в [110, 111].

Богатый материал по устойчивости вычислительных систем к отказам содержится в трудах ежегодного международного, сим­позиума по этой проблеме, проводимого* с 1971 г. [1091—-1098J. Надежности вычислительных систем посвящен выпуск сборника 1857]. Упомянутая в начале настоящей библиографической справ­ки статья [3] является вводной в тематическом выпуске журнала [3981, посвященном отказоустойчивым системам. В вводной статье дается общее представление о проблеме, а в других статьях вы­пуска описываются отказоустойчивые системы PLURIBUS,

COMTRAC, С. mmp, Cm*, С. vmp, FTMP. SIFT, JPL STAR и UDS, рассмотренные в настоящем п. 7.3, а также описывается система ESS.

После проведения в 1953—1959 гг. экспериментальных разра­боток, в 1959—1965 гг. была создана электронная система ком­мутации ESS № 1 (Electronic Switching System) фирмы Bell Telephone [668] на базе быстродействующих локальных процессо­ров, явившаяся важным шагом на пути от электромеханических телефонных систем коммутации к электронным системам и цент­рализованному программированному управлению. Суммарное вре­мя простоя этой системы должно быть не более 2 часов за 40 лет эксплуатации в условиях, допускающих замену неисправных ком­понентов вручную. Все ответственные части этой системы про­дублированы, а для обнаружения, локализации и идентификации неисправных компонентов очень широко применяется программ­ное обеспечение, а также некоторая специализированная аппара­тура. Развитие отказоустойчивых электронных систем коммутации продолжается и в настоящее время [389]. Они являются, вероят­но, самыми многочисленными и- наиболее широко используемыми отказоустойчивыми цифровыми системами [З]. Описание систем ESS, а также JPL STAR и PLURIBUS содержится в обзоре [1115L

Упомянутые выше отказоустойчивые системы, которые рас­смотрены в настоящем 7.3, представлены в следующих работах:

JPL STAR-в [275, 361, 477, 478, 480, 481, 786, 1133], UDS— в [361, 664, 928, 929, 1122, 1123], PLURIBUS и ее прототип— в [201, 559, 785, 814-816, 899, 1019, 1045-1048, 1129, ИЗО]. С. mmp—в [364, 372, 373, 523, 721, 749, 751, 880, 966, 1008, 1019, 1267-1271], Cm*-в [132, 372, 373, 415, 525, 748, 750, 819, 873. 1166, 1205, 1206], С. vmp—в [372, 373, 1165], COMTRAC— в [185, 854, 855, 1051], FTMP-в [420, 838, 839], SIFT—в [405, 1252, 1253]. В 7.3 рассмотрены также вычислительная система TANDEM 16 и вычислительная система космического корабля «Шаттл». Эти системы представлены в [713, 745] и в [614, 685, 960,982,1034,1075, 1076, 1135, 1158, 1169] соответственно. В при­веденных перечнях ссылок "не повторяются ссылки на те работы, в которых содержатся данные о перечисленных здесь системах и которые упомянуты выше в настоящей библиографической справке.