Микроархитектура Sandy Bridge, страница 5

Кольцевая топология и организация шин обеспечивает минимальную временную задержку при обработке запросов, максимальную производительность и отличную масштабируемость технологии для версий кристаллов с различным количеством ядер и других компонентов процессора. По словам представителей корпорации Intel, в перспективе к используемой кольцевой шине может быть подключено до 20 процессорных ядер на одном кристалле. Наибольшее влияние кольцевая шина оказывает влияние на производительность в графических приложениях.

                      Кэш-память последнего уровня

Кэш-память последнего уровня LLCразбита на четыре сегмента, и каждое процессорное ядро имеет прямой доступ к «своему» сегменту. Благодаря кольцевой шине, к которой эта кэш-память подсоединена, произошло снижение задержек обращения к ней и перевод ее работы на частоту процессора. При этом каждый сегмент кэш-памяти L3 предоставляет половину ширины своей шины для связи с кольцевой шиной данных и имеет собственный независимый контроллер доступа к ней. Этот контроллер отвечает за обработку запросов по размещению физических адресов. Кроме того, он постоянно взаимодействует с «системным агентом» по выяснению неудачных обращений к кэш-памяти этого уровня, контроля межкомпонентного обмена данными и некэшируемых обращений.

                        «Системный агент» (SystemAgent)

«Системный агент» (SystemAgent) – понятие, которое разработчики микроархитектуры Sandy Bridge ввели вместо понятия Uncore (Неядро), используемое в микроархитектуре Nehalem, включает в себя те компоненты микропроцессора, которые не могут быть сгруппированы с исполнительными ядрами. В состав системного агента входят: двухканальный контроллер памяти модулей DDR3, поддерживающий скорость передачи до 1333 Мбайт/с; 16 линий PCI Express второго поколения (PCIe×16); локальный последовательный интерфейс DMI (Direct Media Interface), обеспечивающий связь с «южным мостом» чипсета со скоростью до 2 Гбайт/с, модуль медиа-обработки и видеовыхода, а также  улучшенный блок управления энергопотребления PCU (PowerControlUnit), реализующий технологию TurboBoost второго поколения.

Напомним, что технология Turbo Boost – это технология динамической подстройки тактовых частот ядер процессоров фирмы Intel, и напряжения их питания, в зависимости от уровня их загрузки и температуры процессора. При этом, управление это осуществляется исходя из критерия достижения наилучшей энергоэффективности процессора. Появление технологии TurboBoost (TurboMode) возникло в связи с тем, что в многоядерных микропроцессорах далеко не все имеющиеся ресурсы используются даже современными версиями приложений. Многие программы, не слишком приспособленные для реализации в многоядерных системах, могут использовать лишь одно ядро одновременно, не загружая остальные. А поскольку TDP (ThermalDesignPower) кристалла рассчитывается исходя их наихудшего случая, когда все ядра загружены максимально, то технология Turbo Boost использует возникающий резерв по теплоотдаче и перераспределяет тактовые частоты и даже иногда напряжение питания ядер, но так, чтобы в целом максимальное энергопотребление кристалла не превышало критического. Причем, используемый PCU управляет и графическим ядром, однако отдельно от основных исполнительных ядер.

Предусмотрен и специальный экономичный ждущий режим для кольцевой шины, когда она не нагружена, а для кэш-памяти L3 применяется традиционная технология отключения неиспользуемых транзисторов, которая уже использовалась в микропроцессорах архитектур Intel Core.

Модули видеовыхода и мультимедийного аппаратного декодирования также входят в число элементов системного агента. В предыдущих процессорных микроархитектурах аппаратное декодирование реализовывалось  графическим ядром. При микроархитектуре Sandy Bridge используется отдельный, значительно более производительный и экономичный модуль. И только в особых случаях сжатия мультимедийных данных используются  возможности шейдерных блоков графического ядра, которое в этих случаях работает совместно с кэш-памятью LLC.

Судя по всему, кэш-память L3 (LLC) разработчики также включают в состав «системного агента», хотя об этом прямо не говорится.

              Графическое ядро (Grafics – GPU)

Отличием графического ядра микропроцессоров архитектуры Sandy Bridge от микропроцессоров предыдущей архитектуры является в первую очередь то, что оно интегрировано в тот же кристалл, изготавливаемый по технологии 32 нм, что и все остальные компоненты процессора. Кроме того, оно отличается тем, что управление его производительностью и температурным режимом осуществляется не программным путем с помощью специального драйвера, а «системным агентом» на аппаратном уровне. В связи с этим, процессы изменения напряжения питания, тактовой частоты, производительности и энергопотребления встроенной графики реализуются в более широких пределах и с такой же высокой эффективностью, что и изменение параметров ядер процессора.

В целом, по заявлению представителей фирмы Intel, исполнительные блоки графического процессора обладают удвоенной пропускной способностью, по сравнению с предыдущим поколением интегрированной графики, а производительность вычислений с трансцендентными числами (тригонометрия, натуральные логарифмы и т.д.) за счёт акцента на использовании аппаратных вычислительных возможностей модели вырастает в 4-20 раз.

Заметим, что хотя физически модуль обработки медиа располагается, при архитектуре Sandy Bridge, в составе «системного агента», т.е. вне графического процессора, обработка медиа-данных при кодировании (сжатии) мультимедийных потоков  осуществляется совместно с исполнительными блоками графического процессора. (Однако декодирование мультимедийных потоков осуществляется в «системном агенте» полностью аппаратным путем, в специальном модуле, обеспечивающим высокую производительность). Поэтому, несмотря на то, что интегрированная графика, как правило, в настоящее время уступает по производительности автономным видеокартам, тестирование поступивших в продажу микропроцессоров с архитектурой Sandy Bridge показало, что если исключить игровые приложения, используемая структура графики весьма перспективна.