Журнал «Компьютерра» № 10 от 14 марта 2006 года
Обычно Intel трудно обвинить в разговорчивости: техническая информация, касающаяся ее будущей продукции, подается микроскопическими дозами. Однако Merom-Conroe-Woodcrest (или, для краткости, просто Conroe) сейчас так нужен Intel, что порой кажется, будто эти процессоры начнут продаваться уже завтра – столь детально определены их спецификации. Основных изменений в архитектуре P6 по сравнению с Pentium M будет три:
Во-первых, будет сильно переделан главный конвейер. Сохранив некоторые черты конвейера P6 (в частности, Reservation Station), Conroe сможет выполнять не две, а четыре инструкции за такт, причем, в отличие от Pentium 4 (также способного выполнять до четырех инструкций за такт), – в «устоявшемся» режиме и для большего числа x86-инструкций.
Во-вторых, обещают улучшить одно из узких мест P6 – относительно слабый (по сравнению с Pentium 4 и AMD Athlon) блок вычислений с плавающей точкой. К сожалению, информации на сей счет пока маловато, что косвенно свидетельствует о том, что революции здесь не случится.
В-третьих, многоядерные процессоры будут основываться на технологии, общей для всех ядер кэш-памяти второго уровня. Собственно, эта новинка уже «отрабатывается» на новых мобильных процессорах Yonah (Core Duo/Core Solo), но об этом мы подробнее поговорим в другой статье номера, посвященной ноутбукам.
В-четвертых, в ядро введут технологию виртуализации Intel VT, поддержку EM64T и наверняка что-то еще из грядущей LaGrande.
Каждое из трех первых новшеств, взятое по отдельности, способно обеспечить небольшой, но уверенный прирост производительности на мегагерц хотя бы 10–15%; взятые же вместе и дополненные четвертым пунктом, они потенциально могут стать тем самым Vergeltungswaffen["Оружие возмездия" (нем.)], которое нужно Intel для отвоевывания утерянных позиций. Тем более что по многочисленным «утечкам» информации известны и тактовые частоты грядущих семейств. Для Conroe обещают двухъядерные процессоры, работающие на частоте 1,86 ГГц (E6300, $209) и 2,13 ГГц (E6400, $240), с кэш-памятью 2 Мбайт и на частоте 2,40 ГГц (E6600, $316) и 2,67 ГГц (E6700, $530) с кэш-памятью 4 Мбайт. Все они будут использовать быструю 1066-МГц шину QPB, которая сегодня встречается только в самых дорогих процессорах Pentium Extreme Edition. Наверняка будут и «промежуточные» модели, а также удешевленные модификации с меньшим объемом кэш-памяти и меньшей частотой. Серверные Woodcrest получат частоты 1,60 ГГц (Xeon 5110, 230$), 1,86 ГГц (5120, 270$), 2,00 ГГц (5130, 330$), 2,33 ГГц (5140, 470$), 2,66 ГГц (5150, 700$) и 3,00 ГГц (5160, 850$), кэш-память L2 объемом 4 Мбайт и совершенно фантастическую шину на 1333 МГц. Кроме того, в январе ходили слухи о моделях Conroe и на частоты 2,93 и 3,2 ГГц с кэш-памятью 2 Мбайт, а также о некоем Conroe Extreme Edition с частотой 3,33 ГГц, с кэшем L2 в 4 Мбайт, хотя в их появление в третьем квартале этого года верится с трудом. Спору нет, даже «простой» Pentium M, разогнанный до 3,33 ГГц, представляет собой чрезвычайно производительное решение, и что сможет показать на этих частотах улучшенный Conroe с быстрой шиной, даже представить страшно. Но вспомним историю – поначалу (а порой и весьма длительное время) процессоры новых семейств почти всегда не обгоняли, а то и вовсе уступали своим «устаревшим», но хорошо отлаженным родственникам. Сегодня Intel хладнокровно обещает в своих кристаллах обеспечить преимущество над «процессорами конкурента» не менее 30% (а стало быть, еще большее – над своими), но к чему относится это расплывчатое обещание и будет ли оно выполнено, покажет только время.
Быстрее, меньше, холоднее…Intel, с ее многочисленными фабриками и колоссальными доходами, всегда славилась инженерами-технологами. «Тонкие» техпроцессы, новые материалы, усовершенствованные степпинги появлялись у нее и раньше, и быстрее, чем у конкурентов, и корпорация своим преимуществом активно пользовалась. Текущий год не стал исключением – и пока в AMD осторожно заявляют о начале поставок 65-нм процессоров в начале 2007 года, Intel демонстрирует сэмплы изготовленных по 45-нм технологическому процессу модулей SRAM, продает полный спектр 65-нм процессоров и сворачивает «устаревшее» 90-нм производство.
Новый техпроцесс получил вполне привычное название – P1264 (до того использовался 90-нм P1262, а еще раньше – 130-нм P1260), привычные производственные материалы и привычное производственное оборудование – ультрафиолетовые литографические инструменты на основе 193-нм лазеров. Даже в 90-нм P1262 разнообразных технологических новшеств было больше (что уж говорить о принципиально новом P1260) – однако в P1264 удалось обойтись без особых ухищрений, ограничившись лишь небольшими улучшениями и усовершенствованными фазосдвигающими масками. Среди улучшений – переход к использованию в качестве электропроводящего материала силицида никеля (NiSi) и слегка доработанная технология «напряженного кремния», позволяющие снизить (в первом случае – за счет уменьшения электрического сопротивления, а во втором – за счет большего рабочего тока при тех же токах утечки) тепловыделение кристалла. А вот толщину изолирующего оксидного слоя в новом техпроцессе изменять, как это делалось раньше, не стали, сохранив ее на уровне 1,2 нм. Кроме того, в кристалл, ранее насчитывавший семь слоев, добавлен восьмой слой[В свое время AMD за счет этого дополнительного слоя сделала из неудачного, горячего и плохо масштабировавшегося по частоте 130-нм Throughbred-A отличный 130-нм Throughbred-B], позволяющий повысить плотность электрических контактов, скорость распространения электрических сигналов и снизить «межконтактную» емкость. Собрав эти «мелочи» вместе, технологам удалось совершить маленькое чудо: сохранив все преимущества «тонкого» технологического процесса – уменьшить токи утечки кристалла почти вчетверо! И это еще не все: рабочий ток затвора возрос на 10–15%, а электрическая емкость уменьшилась на 20%, что, по словам представителей Intel, обеспечивает почти 30–40-процентный прирост тактовых частот! Заодно всюду, где только можно, внедрили технологию «спящих транзисторов», отключающихся от питания, когда они не используются. Жестокие уроки непрерывно[В продаже успели побывать степпинги C0, D0, E0 и N0, а теперь вот и R0 подоспел…] оптимизировавшегося по тепловыделению сложнейшего ядра Prescott, очевидно, не прошли даром.
Тем не менее, заполучив в свое распоряжение прогрессивный техпроцесс, сильно изменять ядро Pentium 4 Prescott в связи с «похоронами» NetBurst разработчики не стали. Новые ядра (кодовое название CedarMill) «официально» получили кэш-память объемом 2 Мбайт, технологию виртуализации Intel Virtualization Technology (VT-x, aka Vanderpool) и сниженный с 14 до 12 минимальный множитель. Причем (сюрприз, сюрприз!) в степпингах E0 и R0 «старичка» Prescott мы все это уже видели. Даже тактовые частоты, несмотря на явный задел, поднимать не стали: для одноядерных CedarMill верхним пределом сегодня стала частота 3,6 ГГц (понижена с прежних 3,8 ГГц Prescott), а для двухъядерных Presler – 3,55 ГГц (повышена с 3,20 ГГц Smithfield). По сути, почти весь созданный новым технологическим процессом задел для повышения тактовой частоты (а если слова о 40% увеличения быстродействия транзисторов правдивы, то новые Pentium 4 могли бы постепенно достичь 5 ГГц) так и остался неиспользованным (хотя оверклокеры будут счастливы) – Intel улучшила лишь результаты откровенно провального Pentium D 3,20 ГГц. Отчасти это вызвано желанием снизить тепловыделение (в первом приближении оно пропорционально частоте), а отчасти «политическими» мотивами: все-таки NetBurst, при всех своих недостатках, была невероятно прогрессивной архитектурой, и грядущий «суперпроцессор» Conroe мог бы и не догнать «второй Northwood», неожиданно преодолевший технологические проблемы[А вот в Conroe, похоже, из 65-нм выжмут все, что только можно. И похоже, что ценой традиционно немаленького тепловыделения изначально «мобильного» чипа]. Вдобавок, похоже, что увеличенный до 4 Мбайт (2+2) кэш двухъядерников сыграл-таки негативную роль, поскольку снижения TDP для двухъядерных процессоров так и не произошло: оно по-прежнему составляет 130 Вт у старших моделей. Правда, измерения показывают, что новый 955-й Pentium Extreme Edition значительно экономичней прежнего лидера – 840-го (возможно, оценка в 130 Вт для предыдущего поколения была «слегка» оптимистична?), хотя и рассеивает тепла раза в полтора больше, чем сопоставимое по производительности решение конкурента. Так или иначе, на 10–20% тепловыделение новых процессоров снизили – и прекрасно.