Рассмотрим выполнение двух параллельных команд умножения с накоплением, в которых один из сомножителей является общим:
МАС dma1, dma2, AC1;
МАС dma3, dma2, AC2;
Первая команда осуществляет:
- перемножение сомножителей, выбираемых из ячеек памяти данных с адресами dma1, dma2;
- сложение произведения с содержимым аккумулятора АС1;
- размещение результата в аккумуляторе АС1.
Вторая команда осуществляет:
- параллельное перемножение сомножителей, выбираемых из ячеек памяти данных с адресами dma3, dma2;
- сложение произведения с содержимым аккумулятора АС2;
- размещение результата в аккумуляторе АС2.
К выполнению подобных параллельных команд с общим сомножителем можно свести многие алгоритмы. Например, многоканальную обработку. В этом случае в качестве общих сомножителей используются отсчеты входного сигнала, в качестве раздельных коэффициентов, подаваемых по раздельным шинам – два набора коэффициентов. Результаты накапливаются в аккумуляторе. При наличии запаса по производительности можно одновременно обрабатывать 4 канала, сохраняя результат в 4-х аккумуляторах.
Выводы.
Таким образом, во всех МП с улучшенной стандартной архитектурой за счет увеличения количества вычислительных модулей и количества (разрядности) шин передачи данных достигается увеличение количества одновременно выполняемых операций и увеличение производительности процессора. Все они могут производить до двух операций умножения с накоплением за один такт, но при этом усложняется архитектура и система команд процессора, за счет появления многофункциональных комбинированных команд. Чтобы писать эффективные команды на ассемблере, необходимо хорошо знать архитектуру и системы команд процессора. Это в условиях усложнения системы становится более затруднительным. С другой стороны подобная архитектура является недружественной для компиляторов языка высокого уровня (языка С). так как компиляторы эффективно используют только простые команды, характерные для архитектуры RISC.
Процессоры ЦПОС с архитектурой VLIW
Увеличение количества команд, выполняемых одновременно возможно с помощью метода реализованного в процессорах с архитектурой VLIW (Very Long Instructions Word, очень длинное слово команды).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.