2. Так как результат в регистре R4 после выполнения I4 может влиять на операнд в регистре R4, используемый командой I3, мы имеем обратную зависимость I3 ® I4 (antidependence).
3. Поскольку обе команды I5 и I6 изменяют содержимое регистра R6 и он является одним из операндов для I6, мы имеем обе зависимости от потока и выходного результата I5 ® I6 и I5 ® I6.
Таким образом, для корректной работы конвейеров эти зависимости не должны нарушать синхронной их работы, что обычно входит в функции контроля данных компилятором, который вырабатывает корректное расписание для работы этих конвейеров.
Блокировки конвейеров.
Блокировки снижают производительность конвейеров, нарушая их ритмичную работу и снижая общую производительность МП.
Основные причины блокировок: зависимость по данным и конфликт ресурсов исполнительных устройств.
На рис. показаны состояния конвейеров в зависимости от причины конфликтов. На рис. а) слева отсутствие зависимости по данным, справа
I1 ® I2. Команда I2 должна ждать два цикла до перехода к циклу выполнения. Аналогично это может оказать влияние и на команду I4.
На рис. б) показан эффект задержки , вызванный командой I2 (ветвление). Слот задержки (щель) составляет 4 цикла и образуется в результате исполнения ветвления команды I5 на 5-ом цикле. Однако, оба конвейера простаивают до тех пор пока команды с целевым адресом ветвления не появится на 6-ом цикле. В данном конкретном случае команда ветвления не выполнена.
На рис. показаны комбинация проблем конфликтов по данным и ресурсам. Команды I1 и I2 нуждаются в том же самом исполнительном устройстве, а выполнение I4- зависит от данных I2 (I2®I4).
Особенности конвейеров суперконвейерных МП.
Работа конвейеров суперконвейерных в отличие от суперскалярных МП делают упор на временной параллелизм работы, выполнение множественных операций на одних и тех же операционных элементах, глубокую конвейеризацию с быстрыми циклами шины и многофазным тактированием.
Суперконвейерные МП со степенью «n » имеют цикл конвейера 1/n от базового цикла работы. В сравнении со скалярными МП, выполняющим операцию сложения за один цикл, такая же операция в суперконвейерном МП займет «n» коротких циклов. Например, при n=3
временной цикл такого МП будет равен 1/3 базового цикла.
Производительность суперконвейерного МП.
Минимально необходимое время для выполнения N команд в суперконвейерном МП со степенью «n» и с «К» ступенчатым конвейером равна:
базовый цикл скалярного МП
-базовый цикл суперконвейерного МП
Потенциальное ускорение суперконвейерного МП в сравнении с базовым МП:
= ==( )
При N: n , т.е. фактор производительности увеличивается пропорционально «n».Однако, реально производительность таких конвейеров ограничивается сложностью их управления и реально «n» редко превышает величину три.
В качестве примера организации конвейера суперконвейерного процессора рассмотрим МП R4000 фирмы MIPS. Семейство процессоров MIPS представляет пример конвейеров RISC МП ,имеющих хорошо оптимизированные ступени с минимальными блокировками.
Комбинированные суперскалярные, суперконвейерные МП.
Максимальный рост производительности МП часто связан с комбинированным применением двух типов архитектуры. В этом случае добиваются как хорошо оптимизированных по времени работы конвейеров, так и пространственный параллелизм работы множественных исполнительных устройств суперскалярной архитектуры.
Фактор производительности для данного типа конвейеров
Определяется как минимальное время , необходимое для выполнения N- независимых команд для машины со степенью параллелизма-«m,n»:
- базовый цикл ( )
Ускорение, в сравнением с базовой машиной равно:
( )
При N: предел скорости составляет величину
На рис. показана работа идеального конвейера для суперскалярной, суперконвейерные архитектуры МП с
n=m=3.
FDEW
Рис. Работа конвейера
суперперконвейерного МП
с n=3
0 1 2 4 5 6 7 время в базовых циклах
Примерами процессоров, использующих комбинированные суперскалярную, суперконвейерную архитектуры, являются МП
Фирм MIPS- R8000-R10000, Alpha AXP 21026 и др.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.