7.3.4. Системы С. mmp, Cm* и С. vmp. С 1970 г. в университете Карнеги — Меллона проводятся экспериментальные исследования в области многопроцессорных систем с широкой общей полосой пропускания между процессорами и памятью. За это время разработаны, реализованы и введены в эксплуатацию три экспериментальные многопроцессорные системы: С. mmp—высокопроизводительная минипроцессорная система; Cm*—расширяемая модульная микропроцессорная система высокой готовности и С. vmp—отказоустойчивая микропроцессорная система с ограниченной расширяемостью. Цели и технические условия создания этих систем различны, однако, во всех случаях в основу разработки был заложен принцип максимального использования серийной аппаратуры [372, 373]. При этом в проводимых работах одно из центральных мест отведено отказоустойчивости и измерению надежности [3L
Рассмотрим сначала первую из указанных выше систем, следуя [372, 373].
Целью разработки системы С. mmp (Carnegie—Mellon Multi-Mini-Processor) было создание высокопроизводительной дешевой многопроцессорной системы для распознавания речи и образов. Принципы построения С. mmр разрабатывались в 1970 г., когда стоимость мини-ЭВМ была сравнительно высокой. Поэтому выбрана возможно более простая структура системы, а обеспечение надежности и управление ресурсами возложено на программное обеспечение.
Система С. mmp содержит 16 процессоров, каждый из которых представляет собой незначительно модифицированную мини-ЭВМ PDP-11 (см. 3.6) с небольшой локальной памятью емкостью в 8 К байт. Эти процессоры связаны через центральный матричный коммутатор 16Х16 с 16 модулями общей оперативной памяти, что обеспечивает адресное пространство в 32 М байт. Каждый модуль общей памяти имеет емкость в 64 К 16-разрядных слов, т. е. суммарная емкость общей .оперативной памяти равна 2 М байт. В полной 16-процсссорной конфигурации системы 5 процессоров представляют собой PDP-11/20 и 11 процессоров— PDP-11/40. Структурная схема системы изображена на рис. 7.12.
Каждый из процессоров имеет доступ к любому модулю общей памяти. Все процессоры соединены общей межпроцессорной шиной, которая обеспечивает межпроцессорные прерывания с тремя уровнями приоритета, непрерывную передачу 60-разрядного бесповторного тактирующего слова с частотой 250 кГц, а также функции управления (каждый процессор может останавливать, возобновлять и продолжать работу любого другого процессора).
При обращении к общей памяти процессор генерирует 18-разрядный адрес, который преобразуется в блоке отображения адреса в 25-разрядный физический адрес. Конфликты запросов к данному модулю памяти разрешаются при помощи формирования приоритетной очереди запросов в регистрах модуля.
Локальная память каждого процессора подключена к нему через шину UNIBUS. Через эту же шину подключены периферийные устройства: накопители на магнитных дисках (в том числе на магнитных дисках с фиксированными головками), составляющие память второго уровня, и устройства ввода-вывода. Если локальная память есть у каждого процессора, то память второго уровня имеется только у части процессоров, причем ее комплектация неодинакова.
Для, системы разработано программное обеспечение с ядром операционной системы Hydra.
Выбор варианта построения С. mmp на базе существующих мини-ЭВМ ограничил возможности введения механизмов отказоустойчивости. Применяемые в системе модели PDP-11 и шина UNIBUS не имеют средств обнаружения ошибок. Поэтому в общей памяти и в трактах обращения к ней реализован лишь простой контроль на четность, так как применение более эффективных методов только в одной части системы неоправдано. Межпроцессорная шина не имеет аппаратного контроля. Фактически все функции контроля и восстановления осуществляются программно, причем в С. mmp такой подход дает хорошие результаты. Тщательный контроль осуществляется в целях сохранности целостности программного обеспечения.
В целом система после приработки оказалась достаточно надежной: на основе помесячной статистики время работы между отказами экспериментальной системы с учетом всех видов ошибок, приводящих к выходу из строя системы, составляет в среднем 6—15 часов. При этом время простоя после отказа лишь немного превышает 5 минут, причем вмешательство оператора практически не требуется вследствие автоматической повторной загрузки системы (С. mmp не имеет оператора). Матричный коммутатор — самое сложное устройство системы — оказался, неожиданно, одним из наиболее надежных устройств.
Таким образом, в С. mmp достигнутая надежность обеспечена, в основном, за счет применения отработанных серийных компонент аппаратуры, за счет простоты структуры, тщательного выполнения системы и применения программных механизмов отказоустойчивости (в ядре операционной системы).
Систему С. mmp можно отнести к классу МКМДС/ВсОрПк (см. рис. 2.1), если не учитывать различие .между моделями PDP-11/20 и PDP-11/40 и отсутствие общего доступа к периферийным устройствам.
Рассмотрим теперь систему Cm*, следуя [132, 372, 373, 415].
Основной целью разработки Cm* было создание экспериментальной структуры со многими процессорами, которую можно было бы использовать для исследования вариантов организации многопроцессорных систем. Необходимая для экспериментов гибкость Cm* обеспечивается за счет микропрограммных контроллеров межпроцессорной связи.
Работы над созданием системы Cm* на базе БИС были начаты в 1972 г., причем предполагалось создать 100-процессорную систему. Разработка окончательного варианта системы была отложена до появления в 1975 г. сравнительно дешевой микро-ЭВМ LSI-11 фирмы Digital Equipment. Учитывая опыт эксплуатации С. mmp, при разработке Cm* большое внимание уделено вопросам надежности и поддержки операционной системы, а также средствам для облегчения процесса программирования. Кроме этого, предусматривалось обеспечение незаметности для пользователей процесса восстановления после ошибок и оперативности обслуживания без потери производительности.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.