ru24.pro
Все новости
Октябрь
2024

Новый взгляд на суперкомпьютер Colossus AI: NVIDIA и xAI высоко оценивают совместную работу

0

Этим летом компания xAI завершила создание, вероятно, самого крупного на сегодняшний день суперкомпьютера для искусственного интеллекта под названием Colossus . Оснащённый 100.000 ускорителями H100, такой комплекс предъявляет колоссальные требования ко всем компонентам инфраструктуры — от энергоснабжения мощностью около 155 МВт и систем охлаждения до сетевой инфраструктуры. В настоящее время xAI работает над расширением системы: планируется удвоить количество ускорителей до впечатляющих 200.000. По неподтверждённым сообщениям, дополнительные 100.000 ускорителей могут быть усовершенствованными версиями H200.

Чтобы связать между собой существующие 100 000 ускорителей H100, xAI выбрала платформу Spectrum-X от NVIDIA. В суперкомпьютере используют Ethernet-коммутаторы Spectrum SN5600, содержащие до 64 портов 800 GbE, с общей пропускной способностью 51,2 Тбит/с. Сетевые адаптеры BlueField-3 SuperNICs от NVIDIA обеспечивают высокую эффективность передачи сетевого трафика.

На всех трёх уровнях сети NVIDIA стремится достичь пропускной способности в 95% от максимально возможной благодаря аппаратному и программному ...