«Время электроники»
Март
2026
1 2 3 4 5 6 7 8 9 10 11 12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Intel родила «Геракла» для гомоморфного шифрования в 5000 раз быстрее 24-ядерных Xeon

Полностью гомоморфное шифрование (Fully homomorphic encryption, FHE) позволяет выполнять вычисления с зашифрованными данными без их расшифровки, но на стандартных центральных и графических процессорах это происходит медленно.

В Heracles используется 3-нанометровая технология FinFET и память с высокой пропускной способностью, что позволяет эффективно выполнять вычисления с шифрованием в больших масштабах.

По данным Intel, новый чип, созданный специально для ускорения вычислений в FHE, работает на частоте 1,20 ГГц и примерно в 1074–5547 раз быстрее 24-ядерного процессора Intel Xeon W7-3455 Sapphire Rapids, работающего на частоте 2,50–4,80 ГГц, при выполнении семи операций, используемых в этом типе рабочих нагрузок.

С технической точки зрения Heracles кардинально отличается от обычных центральных и графических процессоров, которые с трудом справляются с математическими задачами, связанными с шифрованием. Математика FHE основана на работе с чрезвычайно большими целыми числами, интенсивных полиномиальных вычислениях и сложных преобразованиях данных, которые быстро перегружают процессоры общего назначения. В процессоре Intel Heracles используется специально разработанная архитектура с 8192-поточным вычислительным модулем SIMD, состоящим из 64 пар тайлов (то есть каждая пара тайлов содержит 128 параллельных арифметических каналов), расположенных в виде сетки 8×8. Каждый тайл включает в себя арифметические блоки, оптимизированные для модульного сложения, вычитания, умножения и специализированных операций «бабочка», поддерживающих теоретико-числовые преобразования (NTT) и обратные NTT.

Эти NTT и обратные NTT являются ключевыми элементами зашифрованных вычислений, но требуют интенсивного перемещения данных и тщательно скоординированных перестановок. Кроме того, ускоритель поддерживает автоморфизмы и операции начальной загрузки для устранения накопившегося криптографического шума и обеспечения возможности выполнения более длинных вычислительных цепочек.

Система-на-кристалле работает с 32-битными арифметическими срезами (то есть каждая полоса внутри TP обрабатывает 32-битный арифметический срез), что позволяет сохранить точность и обеспечить высокий уровень параллелизма, значительно повышая эффективность обработки зашифрованных математических данных в больших масштабах. Однако для эффективного явно параллельного выполнения также требуется высокая пропускная способность памяти. Для этого чип оснащен 48 ГБ памяти HBM3 с двумя стеками, а также специальными путями передачи данных, что позволяет максимально увеличить внутреннюю пропускную способность до терабайта в секунду. Чип также оснащен 64 МБ внутренней буферной памяти, большими регистрами и специальными буферами, которые обеспечивают передачу данных к вычислительным модулям.

На пике производительности Hercules достигает примерно 29,5 тераопераций в секунду для примитивов «бабочка», около 9,8 тераопераций в секунду для модульной арифметики и многотерабитной пропускной способности для операций преобразования. Процессор поддерживает несколько основных схем FHE, в том числе BGV, BFV и CKKS, и позволяет программировать различные наборы параметров и уровни безопасности.

Сообщение Intel родила «Геракла» для гомоморфного шифрования в 5000 раз быстрее 24-ядерных Xeon появились сначала на Время электроники.