人脑消耗人体能量需求的五分之一。这听起来很多,但我们的小小灰质细胞工作时却具有令人难以置信的能效:我们大脑所需的能量不超过一个灯泡,它是一个“20W的服务器农场”。
人工智能似乎在越来越多的领域追赶人脑——但相比之下,人工智能是一个真正的“发热大户”。一项研究显示,OpenAI 训练 GPT-3(ChatGPT 最初使用的基础模型)消耗了1287 MW· h。这大约相当于450个德国4口之家全年的用电量。

图1 全球最大的液冷计算机之一:位于美国橡树岭国家实验室的"Frontier"百亿亿次级超级计算机。蓝色管道将冷却液引入服务器,红色管道则将余热排出
人工智能打破了效率与计算需求之间的平衡
过去几十年间,IT 行业的电力需求保持相对稳定。虽然我们的生活和工作越来越依赖于 IT,但能效更高的计算机始终在抵消这种增长。人工智能热潮终结了这种平衡。因此高盛预计,到2030年,全球数据中心的电力需求将比2023年增长165%。
在德国,根据 Borderstep 研究所的数据,2022年数据中心的用电量为17.9 TW·h。该分析机构预计,到2030年,这一数值可能超过每年30 TW·h。
一个计算示例:人工智能先驱英伟达的一台 BooogPU(一种专用于 AI 应用的处理器)消耗1000~1200 W。服务器几乎将电能完全转化为热量。一个仅配备16个 GPU 的服务器系统产生的余热,就相当于过去整个服务器机架的热量,即15 ~20 kW。冷却需求随之急剧上升。那种传统的也是浪费的通过空气冷却并消耗额外能量将余热排到外部的做法,因此变得更加不经济。
液体冷却成为普遍现象
因此,英伟达已宣布其未来的 GPU 将只能使用液体冷却运行。因为液体传导热量的效率远高于空气。这不仅与大型人工智能基础设施相关——例如某些工业公司的人工智能超级计算机,或斯图加特高性能计算中心(HLRS,也被保时捷和通快等公司用于产品开发)。
随着 GPU 的普及,液体冷却现在也正进入大多数企业——直至适用于中型企业。而且液体冷却系统的优势远不止于在人工智能领域发挥。更重要的是,它能改善任何 IT 环境下的能源平衡,例如在运行 SAP 应用程序时。
目前三分之一的电力消耗在冷却上
目标是尽可能低的 PUE 比值(电源使用效率)。理想的 PUE 值为 1.0(即总能耗 = 服务器能耗)。根据 Borderstep 的数据,德国的实际平均值是 1.52。这意味着德国的数据中心需要消耗 1.52 kW的电力来产生 1.0 kW的计算能力,这主要是由于能源密集型的空调和冷却系统。
空气冷却在纯技术层面已达到其极限。因此,明显更有效的液体冷却将很快得到普及。它有几种形式。其中包括浸没式冷却:这种方式很有效服务器运行在冷却液槽中但也非常复杂和昂贵,因此几乎不占重要地位。而气液冷却效果一般,因为虽然服务器本身由液体冷却,但热量随后被排放到数据中心的空气中。
相比之下,直接液体冷却则明显有效得多。这种方式将冷却液直接泵送到热源(例如处理器),余热进入一个封闭的液体循环回路,然后通过热交换器进入第二个回路,由该回路将热量带到外部。这可以节省服务器机柜冷却运行 90% 以上的能耗,因为不再需要耗能的空调技术。
立法要求利用数据中心的余热
在余热利用方面,液体冷却也能得分:因为 DLC 产生的余热根据安装方式不同,温度超过40 ℃。因此,它比仅温热的服务器排气更容易用于区域或远程供热网络。
这也变得十分必要,因为数据中心将余热排入周围空气的做法仍然是常态,这是巨大的能源浪费。
潜力是巨大的。例如,仅法兰克福市的数据中心就足以供应该市所有住宅和办公室的供暖,并且是气候中性的,因为数据中心的余热是一种“副产品”。因此,在法兰克福大都会区,旨在实现这种耦合的项目正层出不穷。

图2 HPE与丹佛斯合作,提供内置液体冷却功能的集装箱式数据中心。此概念缩短了建造时间,允许灵活部署,并简化了余热的利用
第三条途径:集装箱式数据中心
然而,对一个正在运行的数据中心进行改造,使其采用 DLC,既费时费力又几乎不切实际。而传统的新建项目至少需要3年时间,并且非常昂贵。但还有第3条途径:采用标准货运集装箱规格的紧凑型数据中心。通过与驱动、制冷和供热技术供应商丹麦丹佛斯公司合作,HPE 提供的此类集装箱在出厂时就配备了 DLC 和余热利用所需的技术。
集装箱数据中心的建设速度明显快于混凝土建筑。例如,为欧洲航天局在意大利北部建设的一个HPE集装箱数据中心,PUE值为1.09,仅用了9个月就建成。但最重要的是:集装箱数据中心可以根据需要放置在任何需要的地方,无论是靠近区域供热网络的地方,还是城市规划者需要为新建区域提供近距离热源的地方。

图3 位于HPE日内瓦基地的液冷集装箱数据中心,配备了余热利用系统
典范:SAP 运行为丹佛斯公司总部供暖
根据欧洲可持续发展报告规则,未来越来越多的公司必须记录其整个价值链的CO2排放——这意味着也包括其合作的云提供商或数据中心运营商的排放。这也是为什么能源效率日益成为企业采购战略的核心标准的原因之一。
对丹佛斯而言,这已是多年来的准则。当该公司去年面临选择,决定未来在哪里运行其 SAP S/4HANA 应用程序时,它选择了位于丹麦诺德堡总部自有的 IT 环境。
在这里,丹佛斯使用集装箱数据中心和液体冷却,服务器余热通过热泵增强并用于公司建筑的供暖,此外还可以输入本地区域供热网络。热量再利用是丹佛斯脱碳战略的重要组成部分,该战略助力占地 25万m2的丹佛斯中心自2022年起实现了CO2中和。
评论
加载更多