Анализ архитектуры системы Alpha Server GS, страница 3

Узлы кластера могут одновременно использоваться в качестве пользовательских рабочих станций. В случае, когда это не нужно, узлы могут быть существенно облегчены и/или установлены в стойку

[AlphaServer GS]: Система состоит из однородных базовых модулей (плат), состоящих из небольшого числа процессоров и блока памяти. Модули объединены с помощью высокоскоростного коммутатора. Поддерживается единое адресное пространство, аппаратно поддерживается доступ к удаленной памяти, т.е. к памяти других модулей. При этом доступ к локальной памяти в несколько раз быстрее, чем к удаленной

логическая модель основной памяти и механизм межпроцессорного обмена

механизм межпроцессорного обмена в следующей главе.

топология коммуникационной сети

Сервера AlphaServer GS имеют модульную структуру и состоят из базовых блоков (QBB, Quad Building Block), на каждом из которых установлено по 4 процессора Alpha, по 4 банка памяти (до 32 GB) и локальный коммутатор.  Эти базовые блоки объединяются в большую NUMA-систему с помощью "глобального коммутатора" (global switch).


Рис. 1. Блок-диаграмма работы шины

Минимальным модулем системы является QBB (quad building block), который обеспечивает взаимные переключения для 4 процессоров, четырех модулей памяти и порта ввода-вывода для PCI-слота. Пропускная способность памяти для QBB 6.4Gb/сек. Внешняя пропускная способность памяти от QBB 1.6Gb/сек. Два QBB соединяются друг с другом через их глобальные порты. Система с более, чем с двумя QBB нуждается в иерархическом переключателе, который даст возможность сразу 8 QBB взаимодействовать. В каждый QBB можно установить до 2 PCI-блоков, каждое из которых может содержать до 14 PCI слотов



функциональность вычислительных модулей

Модификации GS320, GS160, HPC320, HPC160, GS140, GS60, ES40, DS20 и др. - До 32 новых 731 МГц микропроцессоров Compaq Alpha EV67 в 8- (GS80), 16-(GS160) или 32-процессорных (GS320) конфигурациях

Сравнительная производительность одного процессора (данные на 10 мая 2000)


Рис 2. Производительность GS320 на тесте SPECint2000


Рис 3. Производительность GS320 на тесте SPECfp2000


Производительность системы и архитектурные факторы, влияющие на нее


Результаты сравнения процессора Alpha Server GS320 на тесте SPECint_rate95 (операции с целочисленными значениями)


Рис 4. Производительность GS320 на тесте SPECint_rate95

Рис 5. Результаты сравнения процессора Alpha Server GS320 на тесте SPECfp_rate95 (операции с плавающей точкой)



Производительность систем серии GS сильно зависит от числа процессоров

Рис 6. Результаты сравнения систем Alpha Server GS320 с разным числом процессоров на борту в тесте SPECint_rate2000 (операции с целыми числами)

Рис 7. Результаты сравнения систем Alpha Server GS320 с разным числом процессоров на борту в тесте SPECfp_rate2000 (на операциях с плавающей точкой

Статья: Высокопроизводительный кластер на базе Alpha-серверов проходит ряд тестов программы ASCI

В апреле 1999 года самая большая кластерная система, собранная корпорацией Compaq на базе процессоров Alpha, успешно прошла ряд тестов производительности на реальных задачах, предложенных крупнейшими национальными лабораториями США (Sandia, Los Alamos, Lawrence-Livermore), участниками суперкомпьютерной программы Министерства энергетики ASCI. В частности, на тесте sPPM кластер достиг 33% от своей пиковой производительности. Это тестирование завершило первую фазу крупномасштабного проекта PathForward в рамках программы ASCI, на реализацию которого Compaq и правительство США выделили в общей сложности $22 млн.

Кластерная система, построенная Compaq, состоит из 128 двухпроцессорных серверов DS20 на базе Alpha EV6/500MHz, каждый из которых включает 1GB оперативной памяти. Сервера работают под управлением 64-битной операционной системы Tru64 UNIX. Каждый узел обеспечивает пиковую производительность в 2GFLOP/sec, а весь кластер - 256GFLOP/sec. Согласно 13-й редакции списка Top500, на тесте LIPACK кластер достиг производительность в 154.4GFLOP/sec (60% от пиковой!), решая систему линейных уравнений с 120 тыс. переменных.