Окончание действия закона Мура и искусственный интеллект
Закон Мура (и вытекающий из него закон масштабирования Деннарда) обеспечивал предсказуемое увеличение плотности, скорости, мощности и стоимости транзисторов за счёт геометрического масштабирования планарных полевых МОП-транзисторов на протяжении более 50 лет. В начале 2000-х годов, когда были достигнуты пределы возможностей традиционных транзисторов, этот закон начал нарушаться.
На рисунке показано, что в середине 2000-х годов, несмотря на то что количество транзисторов на кристалле продолжало расти благодаря таким инновациям, как структуры FINFET и Gate-All-Around FET (GAAFET), рост удельной мощности привёл к тому, что энергопотребление стабилизировалось из-за тепловых ограничений, что, в свою очередь, привело к стагнации тактовой частоты.
Развитие ИИ опережает развитие аппаратного обеспечения
В то же время объём работы, выполняемой искусственным интеллектом, растёт беспрецедентными темпами, и этот рост обусловлен такими приложениями, как генеративный ИИ, агентный ИИ и общий искусственный интеллект (AGI).
Требования к вычислениям увеличивались намного быстрее, чем 2-кратное улучшение Закона Мура каждые два года. Количество обучающих вычислений увеличивалось примерно в 750 раз каждые два года, в то время как размер и сложность LLMS, измеряемые количеством параметров, увеличивались в 410 раз каждые два года.
Этот дисбаланс приводит к возникновению узких мест: графические процессоры могут обеспечивать высочайшую пиковую производительность, но их использование ограничено объёмом памяти и пропускной способностью. Быстрое перемещение больших объёмов данных между процессорами и памятью стало ключевым фактором, ограничивающим производительность центров обработки данных. Полупроводниковая промышленность не справляется с требованиями ИИ к вычислительным ресурсам, памяти и межсетевым соединениям.
Строительство центров обработки данных для ИИ приводит к значительному потреблению электроэнергии
Несмотря на эти ограничения, инвестиции в ИИ стремительно растут . Крупные технологические компании, такие как Google, Microsoft, Amazon, Apple и OpenAI, планируют потратить более 300 миллиардов долларов в 2025 году на новые центры обработки данных для ИИ. По оценкам Gartner, общие расходы на центры обработки данных для ИИ составят 475 миллиардов долларов, что на 42% больше, чем в 2024 году. Крупные технологические компании и страны ведут глобальную гонку вооружений, чтобы не отстать в борьбе за превосходство в области искусственного интеллекта, несмотря на неопределённую окупаемость инвестиций.
Дефицит вычислительных ресурсов восполняется за счёт строительства центров обработки данных с большим количеством графических процессоров, тензорных процессоров и ускорителей искусственного интеллекта. Такой подход к масштабированию «грубой силой» создаёт серьёзную проблему с энергопотреблением. Серверы на базе графических процессоров потребляют в 10 раз больше энергии, чем традиционные серверы на базе центральных процессоров, что приводит к резкому росту энергопотребления, как показано на рисунке ниже
Для поддержки обучения будущих моделей в новых центрах обработки данных ИИ потребуется мощность в гигаваттном диапазоне, как показано на рисунке выше. Анализ, проведённый Epoch.ai, показал, что Google, Amazon, Microsoft, OpenAI, Oracle, xAI и другие компании разрабатывают несколько кампусов для центров обработки данных с общей потребляемой мощностью в диапазоне от 1 до 5 гигаватт, которые планируется ввести в эксплуатацию в 2027–2030 годах.
Исследование Министерства энергетики США показало, что в 2023 году общее энергопотребление центров обработки данных составляло 4,4 % от общего энергопотребления в США, а к 2028 году прогнозируется рост до 6,7–12 %. Такой быстрый рост может привести к повышению цен на электроэнергию для потребителей и создать нагрузку на электросети.
… воды
Последние модели графических процессоров потребляют так много энергии и имеют такую высокую плотность компоновки, что традиционное воздушное охлаждение заменяется жидкостным охлаждением чипов и оборудования. По оценкам компании McKinsey and Co., до 40 % всей энергии, потребляемой современным центром обработки данных с искусственным интеллектом, расходуется на системы жидкостного охлаждения.
В результате резко возросло потребление воды в центрах обработки данных. Исследование Министерства энергетики США показало, что в 2023 году центры обработки данных израсходовали 66 миллиардов литров воды, а в 2028 году, по прогнозам, будет израсходовано от 145 до 275 миллиардов литров. В недавней статье Financial Times говорится, что компании уже получают значительную часть воды из регионов, испытывающих нехватку водных ресурсов: в 2023 году 42 % воды, потребляемой Microsoft, 30 % воды, потребляемой Google, и 16 % воды, потребляемой Meta, поступали из водосборных бассейнов, находящихся в зоне риска. Эта тенденция вызывает опасения по поводу влияния инфраструктуры ИИ на местные источники водоснабжения и экосистемы.
Расширение закона Мура — путь к следующему прорыву
Очевидного и быстрого решения этих проблем не существует. В ближайшей перспективе (1–5 лет) отрасль будет разрабатывать стратегии для повышения производительности без использования исключительно масштабирования транзисторов.
- Чиплеты и 3D-упаковка: такие технологии, как Chip-on-Wafer-on-Substrate (CoWoS), позволяют разнородно интегрировать процессоры и память в единый корпус с высокоскоростными межсоединениями. Эта функция уже используется в процессорах текущего поколения, таких как графический процессор Blackwell от NVIDIA и Tensor Processing Unit Ironwood от Google. Это обеспечивает более высокую плотность и эффективность, хотя экосистема всё ещё фрагментирована и в ней отсутствуют стандарты.
- Специализированные процессоры и ускорители: специализированные процессоры (например, Google TPUs, ИИ-ASIC, вычисления в оперативной памяти) повышают эффективность целевых рабочих нагрузок по сравнению с графическими процессорами общего назначения, что приводит к снижению энергопотребления и затрат.
Эти подходы расширяют возможности закона Мура на системном уровне, позволяя выиграть время для более радикальных инноваций.
Что дальше?
Две потенциально революционные технологии способны в долгосрочной перспективе изменить представление о вычислительной технике:
- Квантовые вычисления: используя суперпозицию и квантовую запутанность, кубиты могут решать определённые задачи экспоненциально быстрее, чем классические компьютеры. Однако проблемы со стабильностью, исправлением ошибок и масштабируемостью означают, что до появления чисто квантовых процессоров осталось как минимум десять лет. Гибридные квантово-классические системы могут появиться раньше для решения специализированных задач.
- Оптические (фотонные) вычисления: использование фотонов вместо электронов обещает огромный прирост скорости, пропускной способности и эффективности. Создание полностью оптических транзисторов сегодня нецелесообразно, но гибридные оптико-электронные системы быстро развиваются. Компании разрабатывают оптические матричные умножители и межсоединения, которые могут значительно ускорить работу ИИ. Их можно будет коммерциализировать в течение нескольких лет, что станет прорывом в ближайшем будущем по сравнению с полноценными квантовыми системами.
Другие направления исследований включают изучение новых полупроводниковых материалов (графена, углеродных нанотрубок и широкозонных полупроводников) и нейроморфных вычислений, но они пока далеки от коммерциализации.
Заключение
Полупроводниковая промышленность переживает переломный момент. Закон Мура, который на протяжении десятилетий был движущей силой прогресса в сфере вычислительной техники, теряет свою актуальность как раз в тот момент, когда спрос на искусственный интеллект растёт невиданными темпами. Временные меры, такие как чиплеты, 3D-упаковка и специализированные ускорители, помогут, но они не смогут бесконечно сокращать растущий разрыв.
Долгосрочные решения лежат в основе принципиально новых вычислительных парадигм, таких как квантовые и оптические вычисления. Несмотря на то, что эти технологии всё ещё находятся на стадии разработки, в течение следующего десятилетия могут появиться гибридные подходы, которые позволят устранить некоторые узкие места.
Тем временем бум в сфере ИИ приводит к масштабному строительству центров обработки данных, что оказывает серьёзное влияние на глобальное потребление электроэнергии и воды. Борьба за превосходство в сфере ИИ обеспечивает непрерывный приток инвестиций, несмотря на риски, но при этом возникают насущные вопросы об устойчивости, политике и ограничениях технологического масштабирования.
Хотя предстоящий путь будет тернистым, история показывает, что не стоит недооценивать изобретательность полупроводниковой промышленности. Как и в случае с прошлыми кризисами, вероятно, появятся новые решения, но путь будет полон трудностей.
Сообщение Окончание действия закона Мура и искусственный интеллект появились сначала на Время электроники.