Обзор процессора Xeon E5-2682 v4 с AliExpress: 16 ядер и новое разочарование
Прямые поставки многих комплектующих в Россию нарушились, а параллельный импорт пока не заработал, как задумывалось. Поэтому в отечественных магазинах сложилась не самая благоприятная ситуация с наличием и ценами современных моделей CPU. В таких условиях внимание к себе стали привлекать нетрадиционные варианты конфигурирования платформы ПК. Один из возможных подходов – заказ комплектующих на AliExpress. Нельзя сказать, что это какой-то новый и неизведанный путь – сторонники бюджетных конфигураций пользуются им на протяжении многих лет. Но сейчас он стал значительно популярнее, именно поэтому статьи о таких сборках теперь появляются даже на нашем сайте.
В одном из первых материалов о «китайских платформах» мы рассказали о наиболее популярных вариантах бюджетных конфигураций такого рода, в основе которых лежат серверные LGA2011-3-процессоры Xeon E5 v3 родом из 2015 года, которые попадают на китайскую торговую площадку прямиком из проводящих техническое перевооружение дата-центров. Хотя Xeon E5 v3 производились по 22-нм техпроцессу и имеют довольно слабую по современным меркам микроархитектуру Haswell, сторонники таких платформ считают, что все подобные недостатки может перекрыть количество ядер – среди Xeon E5 v3 есть модели, имеющие до 18 ядер. Впрочем, проведённые нами практические тесты подобных конфигураций в сравнении с современными решениями показали, что наиболее ходовые и распространённые представители семейства Xeon E5 v3 в большинстве случаев проигрывают даже актуальным четырёхъядерникам, особенно если говорить об их игровом применении. Поэтому единственным аргументом в пользу Xeon E5 v3 может стать разве что их низкая стоимость – в сложившейся ситуации покупка платформы на таком процессоре на AliExpress действительно обойдётся существенно дешевле, чем построение системы на базе четырёхъядерного Alder Lake.
Тем не менее разгром, который устроили процессорам Xeon E5 v3 недорогие современные Core i3, Core i5 и Ryzen 5, ещё не означает несостоятельность платформы LGA2011-3 в целом. Дело в том, что она совместима и с более современным семейством CPU, Xeon E5 v4, на что нам справедливо указали читатели в комментариях к пошлому материалу. Такие процессоры имеют микроархитектуру с более высоким показателем IPC, обладают большим числом ядер и производятся по 14-нм техпроцессу, который утратил свою актуальность лишь в прошлом году. Но самое главное, китайские дата-центры понемногу избавляются и от таких процессоров, благодаря чему они вместе с Xeon E5 v3 тоже доступны на AliExpress. Всё это стало поводом дать платформе LGA2011-3 ещё один шанс: возможно, в комплекте с процессорами посвежее она окажется заметно интереснее. К тому же имеющиеся в продаже серверные процессоры семейства Xeon E5 v4 хоть и дороже предшественников, цены на многие из них всё равно ниже, чем у начальных четырёхъядерников серии Alder Lake.
Ассортимент попавших на вторичный рынок б/у Xeon E5 v4, представленный на китайском маркетплейсе в данный момент, довольно ограничен и фактически состоит всего из нескольких моделей с 12, 14, 16 и 22 ядрами. При этом последний вариант оценивается более чем в $230 и вряд ли представляет интерес для массового пользователя. Все же остальные имеющиеся модели хотя и различны по числу ядер, в целом схожи по частотам, которые лежат в диапазоне 2,0-2,5 ГГц с возможностью авторазгона в турборежиме до 2,9-3,3 ГГц. Среди доступных для покупки Xeon E5 v4 для подробных тестов мы выбрали 16-ядерную модель Xeon E5-2682 v4 с наиболее высокими тактовыми частотами – она оценивается китайскими продавцами в сумму порядка $145 и пользуется у приверженцев платформы LGA2011-3 высокой популярностью. На примере данного CPU мы попытаемся понять, можно ли из этой старой серверной платформы выжать более-менее современную производительность. Или же вывод, сделанный ранее, верен и для более свежего поколения «китайских Xeon», и все такие продукты интересны лишь как вариант экономии бюджета при условии, что на фактор быстродействия предполагается вообще не ориентироваться.
⇡#Подробнее о семействе Xeon E5 v4
Семейство процессоров Xeon E5 v4 имеет кодовое имя Broadwell-EP, что однозначно указывает на использование в нём микроархитектуры Broadwell. И уже только это вызывает большой интерес, поскольку в настольном сегменте данная микроархитектура вроде бы прожила очень короткую и малозаметную жизнь длиной лишь в несколько месяцев, но зато ввела в обращение уникальные модели CPU, снабжённые кеш-памятью четвёртого уровня, которая располагалась на отдельном полупроводниковом кристалле с кодовым именем Crystal Well.
Впрочем, Xeon E5 v4 – это совсем другая история. Они вышли на год позже десктопных Broadwell, и L4-кеша в них нет. При этом они стали первыми процессорами для серверов, производимыми по 14-нм технологии. Это позволило нарастить в них количество вычислительных ядер: в то время как старшие Xeon E5 v3 имели 18 ядер, в семействе Xeon E5 v4 появились представители с 22 ядрами. Соответственно, вырос и максимальный объём L3-кеша – у старших версий Broadwell-EP его объём доходит до 55 Мбайт против 45 Мбайт в прошлом семействе.
Ещё одно важное изменение, которое привнесли Xeon E5 v4, касается памяти. Несмотря на то, что Xeon E5 v4 и Xeon E5 v3 совместимы с одной и той же платформой LGA2011-3, более современные процессоры могут работать с более скоростной четырёхканальной DDR4-памятью, частота которой доходит до 2400 МГц. Но вместе с этим в Xeon E5 v4 полностью пропала поддержка старой DDR3-памяти, её нет ни у одной модели.
Однако есть и другая сторона. Запуск производства процессоров по 14-нм техпроцессу у компании Intel проходил со сложностями. Выход первых продуктов на его основе несколько раз переносился, и в конечном итоге они получили совсем не те тактовые частоты, которые планировались изначально. Применительно к Xeon E5 v4 это вылилось в довольно разочаровывающие частотные характеристики, по которым Broadwell-EP как минимум не превосходят предшественников.
К счастью, это вовсе не значит, что всё преимущество Xeon E5 v4 кроется в одном только увеличении количества вычислительных ядер. Хотя ядра Broadwell с точки зрения методологии разработки относились к этапу «тик», то есть к внедрению новых полупроводниковых норм без переделки микроархитектуры, определённые улучшения в них всё-таки есть. Так, сама Intel говорила о примерно 5-процентном улучшении удельной производительности на такт (IPC). А конкретнее, речь шла об ускорении исполнения операций перемножения чисел с плавающей запятой, увеличении TLB второго уровня, улучшении работы алгоритмов предсказания ветвлений и расширении окна планировщика.
Таким образом, от Xeon E5 v4 логично было бы ожидать несколько более высокой производительности, чем от представителей серии Xeon E5 v3, даже если сопоставлять между собой модели с одинаковым количеством ядер. Пусть Broadwell-EP и не будут быстрее с точки зрения паспортных частот, в их пользу должна сыграть более высокочастотная память и микроархитектурные улучшения.
Однако все эти рассуждения способен поставить под сомнение один неприятный нюанс, связанный с частотой: у процессоров Xeon E5 v4 невозможна фиксация максимальной частоты турборежима для состояний с загрузкой более чем одного-двух вычислительных ядер. И если процессоры Xeon E5 v3 путём модификации BIOS материнской платы можно заставить работать на предельной турбочастоте даже при задействовании всех имеющихся ядер, с Xeon E5 v4 этот трюк уже не проходит. И это значит, что в действительности Xeon E5 v4 могут уступать своим предшественникам по реальным частотам в многопоточных нагрузках очень значительно – почти в полтора раза. Простой пример: рассмотренный нами в прошлом обзоре 12-ядерный Xeon E5-2678 v3 после внесения изменений в BIOS всегда удерживал частоту на уровне 3,3 ГГц, а его 12-ядерный последователь Xeon E5-2650 v4 при нагрузке на все ядра неминуемо будет сбрасывать частоту до более низкой отметки — 2,5 ГГц, ограничивающей турбочастоту при многопоточной нагрузке.
По этой причине для данного обзора мы выбрали многоядерного и более высокочастотного представителя семейства Broadwell-EP – 16-ядерник Xeon E5-2682 v4. С одной стороны его превосходство в числе ядер над теми Xeon E5 v3, которые мы тестировали ранее, может стать определяющим фактором и позволить ему показать более близкий к современным CPU уровень производительности. С другой – он имеет сравнительно высокую номинальную тактовую частоту – 2,5 ГГц, и, значит, при тяжёлых многопоточных нагрузках не должен катастрофически проваливаться по частоте на фоне моделей из семейства Xeon E5 v3.
⇡#Xeon E5-2682 v4: характеристики и особенности
Хотя в паспортных характеристиках Xeon E5-2682 v4 записана базовая частота всего 2,5 ГГц, в реальности он может работать на более высокой скорости благодаря турборежиму. Его максимальная частота составляет 3,0 ГГц, он способен удерживать её при нагрузке на одно или два вычислительных ядра. Но и максимально разрешённая турбочастота Xeon E5-2682 v4 при нагрузке на все ядра равна 2,9 ГГц, и на ней он действительно может работать в случае многопоточных, но при этом не очень сложных нагрузок, не задействующих инструкции из наборов AVX или AVX2. Если же дело доходит до работы с векторными инструкциями, то частота процессора тут же падает до 2,5 ГГц.
TDP рассматриваемой модели – 120 Вт, что можно считать довольно средним уровнем энергопотребления по меркам серверных процессоров середины прошлого десятилетия. Но справедливости ради нужно заметить, что на практике представители семейства Broadwell-EP стали заметно холоднее предшественников. Основная заслуга в этом принадлежит, очевидно, 14-нм производственной технологии.
Модель Xeon E5-2682 v4 в иерархии Intel относится к классу Advanced. Это значит, что этот 16-ядерный процессор построен на полупроводниковом кристалле HCC площадью 456 мм2. В нём изначально заложено 24 вычислительных ядра, разделённых на две 12-ядерные группы, каждая из которых пользуется своей собственной кольцевой шиной и имеет собственный двухканальный контроллер памяти. Таким образом, Xeon E5-2682 v4с точки зрения строения является NUMA-процессором, однако используемая в нём схема объединения с двумя коммутаторами в реальности налагает не слишком серьёзный штраф при межъядерном взаимодействии узлов, подключённых к разным шинам, – он не превышает 12 тактов. Однако латентность L3-кеша у процессоров с таким строением всё-таки получается выше, чем у собратьев с одной кольцевой шиной, и заметно – почти в полтора раза.
Тем не менее в однопроцессорных и уж тем более в настольных системах Xeon E5-2682 v4 допустимо использовать в привычном массовому пользователю UMA-режиме (с однородной памятью) и не особенно терять от этого в производительности. Более того, продающиеся на AliExpress китайские материнские платы, совместимые с такими CPU, попросту не дают возможности включения NUMA-конфигурации, хотя в Broadwell-EP это возможно и в однопроцессорных системах с помощью специального режима Cluster-on-Die.
Но зато Xeon E5 v4 прекрасно подходят для тех же самых материнских плат с процессорным разъёмом LGA2011-3, которые китайская промышленность выпускает для Xeon E5 v3. Процессоры разных серий совместимы по выводам, и в Broadwell-EP так же, как и в Haswell-EP, встроен интегрированный стабилизатор напряжения. Поэтому даже BIOS обновлять не потребуется – большинство LGA2011-3-плат имеют поддержку Xeon E5 v4 прямо из коробки. Исключение составляют только платы со слотами DDR3 DIMM – c ними запустить Xeon E5 v4 не получится.