【数据中心】供电:供给侧与消费侧

AI 把电力一夜之间推成了数据中心最贵的瓶颈。过去十年这个行业关心的是带宽、延迟、PUE;现在头号问题变得朴素——电从哪来,够不够,什么时候到位

我顺着这个问题,从供给侧(电从哪来)和消费侧(电花在哪)两端做了一次宏观梳理,记一笔阶段性的研究笔记。

美国犹他州数据中心建设现场
NSA 犹他州数据中心建设期航拍,图中可见多座大型机房建筑——这种几十万平方英尺的体量,对应的稳态电力需求往往是上百兆瓦量级。图源 Wikimedia Commons / Swilsonmc(CC BY-SA 3.0)。

供给侧:电从哪里来

数据中心的供电以电表为界,可以分成两种模式。

表前供电:直接接入公用事业电网

电从当地电网来,按用量付费——这是目前的主流方式。就在一年多前,真正采用就地自建发电(为主电源)的设施仅约 13%,也就是说约 87% 仍主要依赖电网;Bloom Energy 联合产业调研对约 100 位决策者的预测是,到 2030 年自建占比升至约 38%,届时仍有约六成数据中心靠电网[1]

值得单独提一笔的,是近两年很热的「核电 PPA」:

  • 微软 2024 年与 Constellation 签了 20 年期协议,重启停堆的 三哩岛(Three Mile Island)1 号机组——重新命名为 Crane Clean Energy Center,提供 835 MW 全部供给微软的 AI 数据中心,2027–2028 年并网[2]
  • Meta 2025 年 6 月与 Constellation 签了 20 年期协议,包下伊利诺伊州 Clinton 核电站的全部 1,121 MW 输出,从 2027 年 6 月开始[3]
三哩岛核电站,远处可见冷却塔
三哩岛核电站(Three Mile Island)——左侧是已退役的 2 号机组,右侧 1 号机组就是被微软包下来重启的 Crane Clean Energy Center。图源 Wikimedia Commons(CC BY 2.0)。

需要澄清:这类「核电 + AI」的大新闻,结构上仍属于表前供电——数据中心不拥有反应堆,签的是 PPA(购电协议),电仍然要走电网。真正意义上的表后核电是园区内的小型模块化反应堆(SMR),目前还基本停留在规划与首堆建设阶段。

表后供电:数据中心自建发电

发电设备装在数据中心自己一侧,电力不经公用事业电表直接使用。这是目前增长最快的部分,核心驱动力很简单——电网接入排队动辄要等好几年,自建反而成了赶工期最快的路径[1]

表后自建的方案,按部署速度和规模排开,大致是这样一个光谱:

方案部署周期特点代表玩家
燃料电池最快(约 90 天)最敏捷、占地最省、几乎零噪声/无 NOx,适合紧急快速部署Bloom Energy(领跑);FuelCell Energy、Plug Power、Ballard、Doosan
小型燃气轮机 / 往复发动机约 12–24 个月比较稳健,适合中等规模GE Vernova(LM2500/LM6000)、Caterpillar、Cummins;Solaris(租赁)
大型燃气轮机新订单排队至约 2028–2030单机大、规模化最划算GE Vernova、Mitsubishi Power、Siemens Energy
核电(含 SMR)重启约 3 年 / SMR 2030 后规模最大、最稳定、最清洁,长期方案运营商 Constellation、Vistra;SMR 开发 Kairos、NuScale、Oklo
储能配套削峰填谷、平滑波动Tesla(Megapack)、Fluence

燃料电池:最快、最灵活

燃料电池的角色是「速度优先选项」。Bloom Energy 跟 Oracle 的合作里,90 天交付一个数据中心规模的现场电力,实际只用了 55 天就完成了首批模块交付[4]。它的物理形态就是一组集装箱大小的模块,可以拼成 20 MW 到 500 MW+ 的规模,跑天然气、生物气或氢气都行,可用率 99.9%–99.999%[5]

代价是单瓦造价比小型燃气轮机高 10%–15%,但在岛屿化微网(islanded microgrid)、需要 99.9% 可用性的场景里,这个差距会被「燃气轮机为了备份必须超建」的额外成本拉平[6]

四台 Bloom Energy Server 燃料电池模块
Bloom Energy Server(俗称「Bloom 盒子」)——固体氧化物燃料电池(SOFC),单元体积接近一台大冰箱。图源 Wikimedia Commons(CC BY 3.0)。

燃气轮机:规模化的主力

真正撑起表后大规模供电的是燃气轮机。GE Vernova 的 LM2500 至今已经累计交付超过 2,100 台、运行 7,500 万小时;LM6000 累计交付 1,200 多台、运行 6,000 万小时,启动 5 分钟内就能并网[7]。这两个型号是航改型(aeroderivative),来源就是民航客机的发动机,所以皮实、可靠、维护体系成熟。

GE LM2500 燃气轮机检修中
LM2500 燃气轮机——原型是民航 CF6 发动机,广泛用于舰船、海上平台与陆上发电。图源 U.S. Navy(公有领域)。

但目前大型燃气轮机厂商订单已经排到 2028–2030 年,新建的数据中心想要靠这条路,等不起。

核电与 SMR:长期最优解,但暂时远水

SMR 是「表后核电」的核心叙事:把核反应堆做成集装箱级别的模块化产品,工厂出厂、现场拼装,直接落在数据中心园区里。最激进的方案如 Oklo Aurora 计划在 2027–2028 年首堆并网,主流估计是 2030 年前后才有首批商业 SMR 进入数据中心供电;NuScale 已经跟 TVA 签了 6 GW 大单,首座电站目标 2030 年发电;Kairos 的熔盐堆 Hermes-2 也是 2030 年向 TVA 供 50 MW[8]

NuScale Power Module 小型模块化反应堆剖面图
NuScale Power Module 剖面图——一个集成了反应堆、安全壳、蒸汽发生器的模块,设计输出 50–77 MWe。图源 NuScale Power, LLC。

商业模式:设备短长尾,服务大长尾

表后设备商通常采用「设备一次性销售 + 15–20 年长期服务合同」的模式。以 Bloom Energy 截至 2025 年末的积压订单(backlog)为例:产品积压约 60 亿美元,服务积压约 140 亿美元,合计约 200 亿美元——设备 3 : 服务 7,服务才是更厚的长尾[9]

这套模式跟航空发动机厂商(GE、Rolls-Royce)、工业气体公司(Air Liquide)的玩法本质上是一回事:先把贵重的硬件铺出去,再在后续二三十年里慢慢收维护、备件、燃料合同的钱——长期合同锁定客户,服务现金流平滑且抗周期。

消费侧:电花在哪里

供给侧讲完,下一个问题是:这些电进了数据中心之后,究竟花在哪儿了?

Epoch AI 和 American Compute 都用 NVIDIA GB200 的官方参考架构做过拆解,以一个约 171 MW 的参考 AI 数据中心(NVIDIA GB200 NVL72 架构)为例,模块用电占比大致如下[10][11]:

模块占比
GPU约 40%
其他服务器组件(CPU、内存、NVLink、PSU 损耗等)约 22%
冷却系统 + 配电约 29%
网络设备约 9%

冷却那 29% 是按风冷口径计的;换成直液冷,这一块可以压到 15% 以下[10]

GPU 才是真正的耗电主角:H100 700W → B200 1,000W → B300 1,400W——一代比一代猛,8 卡一个机箱不算 CPU 和网络就已经 11.2 kW,B300 起没得选,只能直液冷[12]。对比之下,Intel/AMD 服务器 CPU 单颗大约 300W 上下,根本不是一个量级。

NVIDIA DGX GB200 NVL72 机柜
NVIDIA DGX GB200 NVL72——一个机柜里 72 颗 Blackwell GPU + 36 颗 Grace CPU,整柜功率约 120 kW,标准配置直接液冷。图源 Wikimedia Commons(CC BY-SA 4.0)。

衡量指标:从 PUE 走向 tokens-per-watt

PUE(Power Usage Effectiveness)= 总功率 ÷ IT 功率,越接近 1 越好。这个指标已经用了快二十年,行业全球加权平均长期卡在 1.54 附近,六年没怎么动;但顶尖玩家可以做得很极端——谷歌 2024 年全球数据中心机队的 TTM PUE 是 1.09[13][14]

围绕水、碳还有 WUE(水)和 CUE(碳)两个指标,逻辑跟 PUE 一样,只是分母变了。

AI 时代真正新出现的一组指标,是从「能耗效率」转向「算力产出效率」:

  • Tokens per Watt:每瓦能产出多少 token——衡量的是算力的实际产出,而不是单纯的能耗。
  • 机架功率密度(kW / rack):全球平均仍只有 7.5 kW,但跑 AI 训练的机柜动辄 30–120 kW,差了十几倍。Uptime 调研里只有八分之一的设施有任何 30–59 kW 的机柜,真正能稳定上 100 kW 的还在少数[13]

机架密度的差距,本质就是「老牌通用云的物理空间还能不能装下下一代 GPU」这个问题——很多老数据中心其实并不是「电不够」,而是冷却跟不上、配电没规划、单机柜上限做不到那么高。

小结

  • 供给侧:目前仍以表前(电网)为主(约七八成),表后(自建)是增长最快的部分,内部是「燃料电池 → 小型燃气 → 大型燃气 → 核电」的速度光谱,配储能整合。设备商商业模式是「设备 + 长期服务」,服务才是大头(约 3 : 7)。表前核电 PPA 是巨头的捷径,表后 SMR 是长期叙事——但真正落地至少要等到 2030 年前后。
  • 消费侧:GPU 约 40%、其他服务器约 22%、冷却+配电约 29%、网络约 9%。衡量指标从老一代的 PUE / WUE / CUE,正在向 tokens-per-watt、机架功率密度演进——这俩才是 AI 时代真正稀缺的「产能指标」。

下一阶段我想再单独挖几条线:燃气轮机产能的实际瓶颈在哪、Bloom Energy 在这一波里的真实份额能做到多大、以及 SMR 的成本曲线最终能不能跟燃气竞争——都留给后续。

参考资料