Google TPU Ironwood: Google готовится к буму инференса
На конференции Google Cloud Next ’25 облачное подразделение Google представило новое поколение собственного процессора Tensor Processing Unit (TPU) — Ironwood. Новый чип обеспечивает пиковую производительность до 4 614 TFLOPS при вычислениях в формате FP8. Следуя за NVIDIA и AMD, Google всё чётче ориентирует своё оборудование на задачу инференса — то есть применения уже обученных моделей ИИ. В отличие от процессоров для обучения, Ironwood предназначен преимущественно для запуска больших языковых моделей (LLM) и генераторов изображений, например, Gemini.
Google пока не раскрывает архитектурных деталей, но уже известно, что объём памяти HBM увеличился с 95 до 192 ГБ — скорее всего, используется HBM3E. Пропускная способность памяти выросла с 2,8 до 7,4 ТБ/с, что сопоставимо с последними решениями AMD и NVIDIA.
Кроме того, Google теперь может собирать кластеры (Pods) до 9 216 TPU, которые ...