Athlon и Pentium III. Сравнение современных процессоров двух корпораций Intel и AMD, страница 6

Кэш-память L1 всегда располагается в самом процессоре. Ранние варианты двухуровневой кэш памяти предусматривали использование внешней по отношению к процессорному кристаллу L2 кэш памяти, присоединяемой по процессорной шине. Это довольно медленное решение, так как процессорная шина работает на невысокой по сравнению с ядром частоте, да к тому же обслуживает и другие устройства. Ускорить работу позволила двухшинная архитектура, в которой L2 кэш-память присоединялась по отдельной шине. При этом L2 кэш-память располагалась вблизи процессорного кристалла, непосредственно в корпусе (картридже) процессора, то есть встраивалась в процессор. Основная процессорная шина стала называться FSB (Front Side Bus), а дополнительная — BSB (Back Side Bus). Шина BSB может работать на более высокой, чем FSB, частоте, вплоть до полной тактовой частоты процессора. Обычно BSB работала на половине тактовой частоты процессора. Следующий шаг к повышению производительности кэш-памяти заключался в размещении кэш-памяти 2-го уровня непосредственно на кристалле процессора (это стало практически целесообразным начиная с 0.25 мкм технологического процесса). Интегрированная L2 кэш-память обычно меньше по объему, но быстрее, чем внешняя. Для нее можно сделать более широкую шину BSB, работающую на полной тактовой частоте, можно также повысить ассоциативность, сделать структуру многобанковой и многопортовой.

Расширение системы команд.

Еще один путь к повышению производительности универсальных (центральных) процессоров — расширение системы команд за счет введения поддержки потоковых команд SIMD (Single Instruction Multiple Data), широко применяющихся в сигнальных процессорах DSP (Digital Signal Processor). Введение таких команд, предназначенных для групповой обработки однородных данных, значительно ускоряет выполнение аудио- и видео- приложений.

Упомянутые выше решения используются во всех современных процессорах. Фирма Intel в процессорах х86 применяет конвейеризацию начиная с процессоров серии 486, суперскалярная архитектура появилась в процессорах серии Р5, динамическое исполнение (под которым подразумеваются исполнение с изменением порядка, спекулятивное исполнение и некоторые другие приемы) — в процессорах серии Р6. Кэш-память L1 впервые появилась у процессоров 486, шина BSB — у Р6, интегрированная L2 кэш-память — у Р6 (Celeron и Pentium III). Первое SIMD расширение команд — ММХ (Multi-Media extension) — было реализовано в процессорах Р5 (Pentium ММХ).

Эволюция процессоров Р6 и К7

Ведущими мировыми производителями процессоров х86 являются фирмы Intel (около 78% рынка) и AMD (около 22% рынка). Большая часть выпускаемых в настоящее время процессоров Intel (Pentium III, Celeron, Xeon) базируется на архитектуре Intel P6, относящейся к 6-му поколению (процессор 7-го поколения — Pentium 4 — выпускается пока в ограниченных количествах). Современные процессоры AMD (Athlon и Duron) базируются на

архитектуре AMD/NexGen K7, которую сама AMD и некоторые аналитики относят к 7-му поколению (разделение по поколениям при сравнении процессоров с разной архитектурой очень условно и базируется в основном на величине прироста производительности). Процессоры AMD с архитектурой предыдущего поколения — Кб — практически больше не выпускаются.

В Р6 и К7 заложены все основные архитектурные решения, характерные для современных процессоров. Это суперскалярные, глубоко конвейеризованные процессоры с эффективной системой предсказания переходов, использующие исполнение вне порядка следования инструкций, спекулятивное исполнение и другие решения для повышения производительности. Процессоры имеют двухуровневую кэш-память и расширенные системы команд.

По мере развития технологии не только росла тактовая частота процессоров, но и эволюционировала их архитектура, так как появлялась возможность размещать на кристалле все больше элементов. В основном это отражалось на процессорной кэш-памяти. Менялся также конструктив, совершенствовалась системная шина (см. таблицу 2).