Журнал «Компьютерра» N 38 от 17 октября 2006 года
Еще один довольно острый вопрос - будут ли востребованы все эти многоядерные процессоры, в том плане, что большое количество ПО до сих пор не оптимизировано даже под двухъядерные CPU. Исключением, пожалуй, можно считать серверы, которые во все времена были многопроцессорными, а потому - рассчитанными на использование распараллеленного ПО: для них переход на новые «камни» обещает пройти гладко. Правда, очень большую роль тут играет обслуживающая процессор инфраструктура, которая нередко стоит куда дороже собственно процессора, а с этим делом у Intel в последнее время дела обстояли не очень хорошо, что выразилось в ослаблении позиций в традиционно консервативном серверном сегменте и тоже дало лишний козырь AMD, последние несколько лет ориентирующейся как раз на развитие собственной инфраструктуры, «платформы» с максимально продолжительным сроком жизни и вдобавок открытой для всех желающих ее улучшить. Поэтому единственная демонстрация на Форуме, в которой напрямую сравнивались Intel и AMD, была посвящена именно серверным четырехъядерникам. Проводивший ее Пэт Гелсингер устроил небольшую эффектную сценку с демонстрацией «в реальном времени» двух соревнующихся систем и образцово-показательными замерами, в которых двухъядерный Xeon значительно обошел двухъядерный Opteron не только по скорости, но и по энергопотреблению, после чего был за пару минут заменен на четырехъядерный, который увеличил отрыв в производительности еще больше, почти до двукратного, и все равно показал меньшее энергопотребление. Но несмотря на бодрые реляции о том, что TDP для серверных квадов по сравнению с дуалами увеличен не будет, а грядущие низковольтные версии еще и снизят его до 50 Вт, боюсь, в реальной жизни дела будут обстоять не столь радужно. Все же не случайно запущенный на сцене четырехъядерник работал на гораздо более низкой частоте, чем его двухъядерные оппоненты, а в качестве тестового приложения было выбрано прекрасно распараллеливающееся практически на любых системах перемножение пары огромных матриц, на котором было показано отнюдь не двукратное увеличение производительности, ожидающееся от квадов.
На рынке десктопных процессоров системы на базе четырех чипов Core тоже встречает своя ложка дегтя. Поскольку серьезных оптимизаций под многоядерные системы до сих пор нет, а конкурент, оглушенный чрезвычайно удачным Core 2 Duo, особенно не сопротивляется, то с выводом на этот рынок квадов Intel спешить не будет, постаравшись для начала выжать побольше из двухъядерных CPU. А в качестве своеобразного Killer App, ориентированного на ближайшее будущее, предлагает задействовать многоядерники… под компьютерные игры! Вернее, под их следующее поколение, поскольку все предыдущие, за редкими исключениями, с многопоточностью не дружили. Впрочем, Intel довольно убедительно объясняла на Форуме, что эта нелюбовь обусловлена не столько высокой технической сложностью реализации подобной поддержки, сколько тем, что вплоть до недавнего времени подобным образом нельзя было добиться по-настоящему серьезного увеличения быстродействия: графика в играх, как ни крути, от добавления хоть двадцать пятого ядра работать быстрее не станет, а конкурировать с видеокартой на ее поле сегодня способен разве что Cell, да и то с большим скрипом. Но в свете повсеместного перехода к «реалистичной физике» и под давлением производителей процессоров ситуация, похоже, обещает перемениться. В частности, на Форуме демонстрировали потрясающе красивую демку одного из интереснейших (причем не только по графике, но и геймплею) проектов 2007 года - Alan Wake, который сносно шел на кваде, но безбожно тормозил на дуале. Забавно, кстати, что как раз игровая физика на меня особого впечатления не произвела, - ATI подобные фокусы на своих видеокартах показывала еще полгода назад. Впрочем, судить о том, права ли в своих радужных прогнозах Intel или нет, пока рано. В любом случае, ее первые «потребительские» квады будут ориентированы на геймеров, невзирая даже на то, что к моменту их выхода ни Alan Wake, ни других «заточенных» под многоядерники тайтлов на полках магазинов еще не будет. AMD, кстати, тоже не отстает, хотя и в другой области, - лишенная возможности, как Intel, объединять пару ядер в общем корпусе, она готовится выпустить для геймеров платформу 4x4, в которой будет задействована пара двухъядерных процессоров. Кто круче - кит или слон, покажет время.
Еще одной интересной новостью, напрямую связанной с процессорами и извечным противостоянием «заклятых друзей» [Популярной на Форуме шуткой стал перехваченный в одной из демонстраций «хакером» пароль Гелсингера «i hate amd»], стал ответ Intel на анонсированную ранее платформу AMD Torrenza. Напомню вкратце, что речь идет о том, чтобы подключать разнообразные быстродействующие устройства напрямую к центральным процессорам. Например, вставлять сетевую карту (вернее, ее сверхбыстродействующий аналог, типа InfiniBand, применяемой в кластерах) в специальный слот расширения HTX, являющийся давно ожидавшимся коннектором для шины HyperTransport, несколько линков которой, как известно, к процессорам AMD можно подключить напрямую и которая демонстрирует потрясающе низкую латентность при общей простоте и солидной пропускной способности. Более того, AMD объявила о масштабной программе создания специализированных ускорителей, устанавливающихся в многопроцессорной системе прямо в стандартный процессорный сокет, так что в 4P-системе будущего, предназначенной для HPC, скажем, вполне может оказаться один двухъядерный Opteron и три математических сопроцессора от ClearSpeed, которые выдадут на-гора в оптимизированных приложениях (а для HPC оптимизация - не проблема) такую производительность, что никакие восьмиядерники от Intel не смогут ее покрыть. Вкупе с таким интересным решением, как давно обещанный чип Horus (заслуживающий отдельного разговора, но тоже вписывающийся в общую концепцию Torrenza), даже при общем проигрыше процессоров и по производительности, и по энергопотреблению решениям Intel, это выводит платформу AMD вперед, причем в очень «вкусном» и «денежном» высшем сегменте серверного рынка. Причем это не просто слова - уже демонстрируются первые решения для данной платформы, а IBM планирует в ближайшее время построить на ее основе (использовав в качестве «сопроцессора» собственный процессор Cell) новый, самый быстрый в мире суперкомпьютер, который первым в истории перешагнет петафлопсный рубеж производительности в тесте LINPACK. По-видимому, Intel просто не могла не ответить на столь дерзкий и впечатляющий, но очень красивый и логичный выпад и неожиданно для многих сообщила о нацеленных на те же сегменты разработках. Только вместо HTX было сказано о разработке специально оптимизированного под очень быструю периферию варианта PCI Express и о лицензировании собственной процессорной шины для использования в ПЛИС Altera и Xilinx, которые тоже смогут устанавливаться в стандартные процессорные слоты в MP-системах. Если проводить параллели, то вариант с PCI Express уступает HTX в латентности, но сопоставим или даже выигрывает по пропускной способности, и несомненно выиграет по совместимости и распространенности - уж Intel об этом позаботится. С сопроцессорами, видимо, все-таки впереди AMD - разработчикам сопроцессоров для Intel придется лицензировать у корпорации по-прежнему остающуюся «политическим» инструментом FSB, чего не нужно делать в AMDшном случае. К тому же при установке в стандартный процессорный слот (что, в общем-то, делать необязательно - здесь обе платформы довольно гибки) получает помимо стандартной «общей» еще и два канала «персональной» оперативной памяти DDR2, вплоть до DDR2-667 сегодня и до куда более быстрых вариантов DDR3 - завтра.