NVIDIA вместе с Oracle создаст ИИ-кластер мощностью 2,4 Зфлопс: 131 тысяча видеокарт B200 под капотом
Вчера, 11 сентября, в официальном блоге компании NVIDIA появилась информация о том, что производитель графических ускорителей объединился с Oracle Cloud Infrastructure для создания нового крупнейшего на рынке облачного суперкластера, который предоставит корпоративным клиентам просто безумную производительность. Данный кластер позволяет компаниям заниматься обучением и развёртыванием больших языковых моделей искусственного интеллекта, используя графические ускорители NVIDIA Blackwell так, как им удобно. Например, клиенты могут сформировать необходимую инфраструктуру как локально, так и в публичном или приватном облаке.
Более того, главной фишкой новых систем, собранных на базе платформы Blackwell, является возможность масштабирования до 131 072 графических ускорителей B200 с сетевыми адаптерами NVIDIA ConnectX-7 для сетей RoCEv2 или NVIDIA Quantum-2 для InfiniBand. В конечном итоге готовая система способна демонстрировать производительность на уровне 2,4 Зфлопса при выполнении ИИ-вычислений в облаке. Специалисты отмечают, что на данный момент это первая в мире система, способная предоставить настолько высокую производительность, но поступит в продажу она только в первом квартале 2025 года — даже примерную стоимость производитель не сообщает.
Журналисты информационного издания Tom's Hardware отмечают, что новинка от NVIDIA и Oracle предоставит потенциальному покупателю в три раза больше графических ускорителей, чем суперкомпьютер Frontier, основанный на базе 37 888 графических процессорах AMD Instinct MI250X, и в шесть раз больше чипов, чем любая другая система на рынке. Учитывая безумный рост популярности искусственного интеллекта абсолютно во всех сферах жизнедеятельности человека, это выглядит вполне логичным решением, хотя у нового альянса есть и более доступные решения на базе 32 768 ускорителей A100, 16 384 чипов H100 или даже 3 840 графических ускорителей L40S.
Примечательно, что новые суперкластеры будут задействовать новые серверные шкафы GB200 NVL72, которые оборудованы жидкостной системой охлаждения и поставляются с 72 графическими процессорами. Каждый шкаф связан с единой системой посредством технологии NVLink с пропускной способностью до 129,6 ТБ/сек, а оценить суммарное энергопотребление этого суперкомпьютера пока что не представляется возможным. Но это, безусловно, очень «прожорливый» компьютер будущего.