Hardwareluxx Russia
Апрель
2025
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18
19
20
21
22
23
24
25
26
27
28
29
30

Google TPU Ironwood: Google готовится к буму инференса

0

На конференции Google Cloud Next ’25 облачное подразделение Google представило новое поколение собственного процессора Tensor Processing Unit (TPU) — Ironwood. Новый чип обеспечивает пиковую производительность до 4 614 TFLOPS при вычислениях в формате FP8. Следуя за NVIDIA и AMD, Google всё чётче ориентирует своё оборудование на задачу инференса — то есть применения уже обученных моделей ИИ. В отличие от процессоров для обучения, Ironwood предназначен преимущественно для запуска больших языковых моделей (LLM) и генераторов изображений, например, Gemini.

Google пока не раскрывает архитектурных деталей, но уже известно, что объём памяти HBM увеличился с 95 до 192 ГБ — скорее всего, используется HBM3E. Пропускная способность памяти выросла с 2,8 до 7,4 ТБ/с, что сопоставимо с последними решениями AMD и NVIDIA.

Кроме того, Google теперь может собирать кластеры (Pods) до 9 216 TPU, которые ...