Анализ аппаратного и программного способов внесения избыточности в целях устойчивости к отказам вычислительных систем выполнен в [528]. Выделяются три метода внесения избыточности: аппаратный, программный и временной. При этом первый подразделяется на метод статического внесения избыточности (например, тройное резервирование с голосованием) и метод динамического внесения избыточности (резервирование с «холодным» и «горячим» резервом и с идентификацией отказа). Программная избыточность предполагает наличие дополнительного программного кода, а временная избыточность предполагает повторение операций, в -которых были обнаружены ошибки, путем перезапуска программ от контрольных точек. Анализ отказоустойчивости выполнен в обзоре [1198]. Прикладные аспекты теории отказоустойчивых вычислительных систем (анализ, проектирование и моделирование) изложены в, [111-1]. Краткий библиографический обзор аппаратного и программного обеспечения высокой надежности применительно к стоуктупам параллельных вычислительных систем содержится в [110, 111].
Богатый материал по устойчивости вычислительных систем к отказам содержится в трудах ежегодного международного, симпозиума по этой проблеме, проводимого* с 1971 г. [1091—-1098J. Надежности вычислительных систем посвящен выпуск сборника 1857]. Упомянутая в начале настоящей библиографической справки статья [3] является вводной в тематическом выпуске журнала [3981, посвященном отказоустойчивым системам. В вводной статье дается общее представление о проблеме, а в других статьях выпуска описываются отказоустойчивые системы PLURIBUS,
COMTRAC, С. mmp, Cm*, С. vmp, FTMP. SIFT, JPL STAR и UDS, рассмотренные в настоящем п. 7.3, а также описывается система ESS.
После проведения в 1953—1959 гг. экспериментальных разработок, в 1959—1965 гг. была создана электронная система коммутации ESS № 1 (Electronic Switching System) фирмы Bell Telephone [668] на базе быстродействующих локальных процессоров, явившаяся важным шагом на пути от электромеханических телефонных систем коммутации к электронным системам и централизованному программированному управлению. Суммарное время простоя этой системы должно быть не более 2 часов за 40 лет эксплуатации в условиях, допускающих замену неисправных компонентов вручную. Все ответственные части этой системы продублированы, а для обнаружения, локализации и идентификации неисправных компонентов очень широко применяется программное обеспечение, а также некоторая специализированная аппаратура. Развитие отказоустойчивых электронных систем коммутации продолжается и в настоящее время [389]. Они являются, вероятно, самыми многочисленными и- наиболее широко используемыми отказоустойчивыми цифровыми системами [З]. Описание систем ESS, а также JPL STAR и PLURIBUS содержится в обзоре [1115L
Упомянутые выше отказоустойчивые системы, которые рассмотрены в настоящем 7.3, представлены в следующих работах:
JPL STAR-в [275, 361, 477, 478, 480, 481, 786, 1133], UDS— в [361, 664, 928, 929, 1122, 1123], PLURIBUS и ее прототип— в [201, 559, 785, 814-816, 899, 1019, 1045-1048, 1129, ИЗО]. С. mmp—в [364, 372, 373, 523, 721, 749, 751, 880, 966, 1008, 1019, 1267-1271], Cm*-в [132, 372, 373, 415, 525, 748, 750, 819, 873. 1166, 1205, 1206], С. vmp—в [372, 373, 1165], COMTRAC— в [185, 854, 855, 1051], FTMP-в [420, 838, 839], SIFT—в [405, 1252, 1253]. В 7.3 рассмотрены также вычислительная система TANDEM 16 и вычислительная система космического корабля «Шаттл». Эти системы представлены в [713, 745] и в [614, 685, 960,982,1034,1075, 1076, 1135, 1158, 1169] соответственно. В приведенных перечнях ссылок "не повторяются ссылки на те работы, в которых содержатся данные о перечисленных здесь системах и которые упомянуты выше в настоящей библиографической справке.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.