Xeon e5 2696 v3

xeon_e5_2696v3_logo-293x300

Xeon e5 2696 v3 — самый производительный 18-ядерник в линейке. Помимо внушительного количества ядер, модель выделяется достаточно высокой частотой и возможностью работать как с память формата DDR4, так и с DDR3.

Как и Xeon e5 2678 v3 и Xeon e5 2666 v3, процессор относится к OEM-моделям и информацию о нём нельзя найти на сайте Intel. Подобные CPU выпускались специально для определенных компаний и отсутствовали в свободной продаже. Вероятно, процессор является немного модифицированной версией Xeon e5 2699 v3.

Характеристики

Модель Xeon e5 2696 v3
Тех.процесс 22 nm
Ядер 18
Потоков 36
Поддержка оперативной памяти DDR4: 2133 Мгц
DDR3: 2133 Мгц
Базовая частота 2300 MHz
Максимальная частота в Turbo Boost 3800 MHz (1-2 ядра)
3600 MHz (3 ядра)
3500 MHz (4 ядра)
3400 MHz (5 ядер)
3300 MHz (6 ядер)
3200 MHz (7 ядер)
3100 MHz (8 ядер)
3000 MHz (9 ядер)
2900 MHz (10 ядер)
2800 MHz (11 и больше ядер)
Кэш 45 Mb
TDP 145 W
Макс. температура крышки процессора ~76°C
Множитель заблокирован
Примерная стоимость $120 - $140
xeon_e5_2696v3_cpu-z-300x282

Модель не предназначена для бюджетных материнских плат и предъявляет достаточно высокие требования как подсистеме питания, так и к охлаждению.

Среди китайских моделей стабильную работу могут обеспечить платы уровня Huananzhi X99-TF \ X99-F8 \ X99-T8 (первых ревизий), Jingsha X99-8D3, Jingsha X99-D8Jingyue X99 Titanium D4. Для двухсокетных конфигураций — Huananzhi X99-F8D \ X99-T8D.

xeon_e5_2696v3_aida64_mem_speed-300x272

Из-за особенностей архитектуры многоядерных процессоров Haswell, не стоит рассчитывать на латентность памяти ниже 70 ns.

Справиться с тепловыделением смогут башенные кулеры с 5-6 теплотрубками (неплохой бюджетный вариант — шеститрубочный Snowman). Если планируется использовать процессор при длительных высоких нагрузках — не лишним будет позаботиться также о дополнительном обдуве зоны vrm материнской платы.

Анлок турбо-буста

Как и для всех процессоров на архитектуре Haswell, для E5 2696 v3 доступен анлок турбо-буста. Данный хак позволяет зафиксировать максимальную частоту ТБ для всех ядер (в данном случае — 3.8 ГГц). Такая возможность доступна для ревизий pre-QS и выше.

Выполняется анлок путем модификации биоса платы. Для китайских плат инструкция и необходимый софт находятся здесь. Работает хак и на двухсокетных материнках.

Анлок турбобуста увеличит как температуру, так и потребление энергии. Рекомендуется заранее позаботиться об охлаждении как процессора, так и силовых элементов материнской платы.

Несмотря на достаточно высокий TDP, даже 145W явно недостаточно для удержания максимальной частоты по всем ядрам в максимальной нагрузке (рендеринг, тяжелые бенчмарки и т.п.). Процессор будет вынужден сбрасывать частоты для того чтобы уложиться в лимиты TDP и EDP. Несколько улучшить ситуацию может андервольтинг. Большинство экземпляров стабильно работают при напряжении -50 mV, наиболее удачные камни могут сохранять стабильность при -70 и даже -100 mV.

С андервольтом в большинстве случаев можно рассчитывать на 3.0 — 3.4 ГГц по всем ядрам в зависимости от нагрузки. В случае AVX-нагрузок частота просаживается до 2.8 — 3.0 ГГц. Подобное поведение характерно для всех многоядерных высокопроизводительных процессоров с заблокированным множителем серии v3.

Для ситуаций, когда максимальная частота является более приоритетной, чем многопоточная производительность, можно прибегнуть к отключению Hyper Threading или нескольких ядер. В таком случае процессор сможет более эффективно удерживать высокую частоту. Для получения стабильных 3.8 ГГц в максимальной нагрузке придется отключить 8-10 ядер.

Владельцы брендовых материнских плат могут также слегка разогнать шину, получив тем самым дополнительные 3-5% производительности.

Отключение лимита TDP

Существует способ обойти лимит TDP -  использованиt бага SVID/FIVR, однако использовать его на китайских платах следует с большой осторожностью, так как без лимита по TDP в тяжелых задачах потребляемая энергия может сильно превышать безопасные значения, что может привести к выходу из строя материнской платы и\или процессора.

Стоит также помнить, что даже при активированном баге SVID/FIVR, всё еще остается активным лимит EDP (способов его обойти на данный момент не существует), поэтому добиться максимальной частоты в нагрузке всё равно не получится, однако получить некоторый прирост производительности можно.

svid_fivr-300x218

При использовании S3TurboTool активировать баг SVID\FIVR можно при создании драйвера.

Производительность и тесты

Несмотря на сброс частоты в нагрузке, процессор показывает один из лучших уровней многопоточной производительности среди всей линейки Xeon e5 2600 v3. Результаты тестов очень близки к Xeon e5 2699 v3.

xeon_e5_2696v3_cpu-z_benchmark_stock_vs_unlock-300x139

Бэнчмарк CPU-z до и после анлока ТБ


xeon_e5_2696v3_cinebench_r15_r20_r23_unlock_undervolt-300x77

Средние результаты в cinebench r15, r20 и r23 для процессора с анлоком и андервольтом


xeon_e5_2696v3_geekbench5-256x300

Средний результат в Geekbench5 для процессора с анлоком


xeon_e5_2696v3_corona_bench-290x300

В бенчмарке Corona 1.3 анлокнутый процессор с хорошим андервольтом справляется за 01:05-01:10

В играх процессор показывает себя достаточно хорошо, хотя проектов, способных использовать все 36 потоков на данный момент не так много и часть ядер просто простаивает. В большинстве современных игр, хорошо задействующих многопоточность, анлокнутый E5 2696 v3 работает на частоте 3.2-3.4 ГГц по всем ядрам. Добиться еще немного большей производительности можно отключив Hyper Threading или несколько ядер.

Больше тестов в бенчмарках и играх можно увидеть в видео-обзорах.

Тесты процессора с анлоком и андервольтом -100 mV:

Тесты с анлоком и андервольтом -80 mV в сравнении с Xeon e5 2698 v3:

Ревизии

Помимо финальной версии, имеющей код S-spec SR1XK и относящейся к степпингу R2, существуют и различные предрелизные и инженерные версии.

Степпинг Код S-spec
A0 (ES1) QEY8
M0/C0 (Pre-QS) QG7U
M1/C1/R2 (QS/OEM) QGN7

QEY8 может определяться на китайских платах как ES-версия Xeon e5 2695 v3. В таком случае работать будут только 14 ядер и 28 потоков. Вероятно, данная особенность связана с биосом, однако вариантов решения на данный момент не известно.

При покупке рекомендуется запросить у продавца скриншот cpu-z или HwInfo, где будет виден Stepping. Подробнее о степпингах и их значении можно прочитать здесь.

Где купить

Приобрести процессор можно на ebay, taobao и aliexpress. Последний вариант наиболее удобен, так как не требует посредника для доставки.

Продавцы на али:

Оперативная память DDR4

Десктопная (перед покупкой проверяйте отзывы на предмет совместимости с LGA2011-3, не лишним также будет при заказе написать продавцу для какой системы приобретается память):

Серверная (100% совместимость с LGA2011-3):

Серверная DDR3