AI水资源消耗惊人,液体冷却技术成数据中心新宠

逢纪说科技 2024-09-08 01:48:33

AI这个概念曾经是科幻小说和学术研究中的抽象主题,但在过去两年,它已成为餐桌上的热门话题。

这种转变使人们广泛意识到这项技术对环境的影响,最突出的是集中在训练和部署这些模型所需的大量电力和水资源。这也是可以理解的。

最近一份报告发现,全球数据中心集聚地——北维吉尼亚的数据中心水资源消耗在过去五年中增加了三分之二。

“ChatGPT需要“喝”一瓶500毫升的水才能进行一次简单的对话,大约20-50个问答,具体取决于ChatGPT部署的时间和地点,”研究人员在去年年初发布的一篇论文中估计道。

更糟糕的是,这是针对一个约1,750亿参数的GPT-3类模型,以今天的标准来看,这个数字在今天看来微不足道。GPT-4据估计拥有1.7至1.8兆参数,正如OpenAI的Trevor Cai上周在他的Hot Chips主题演讲中所说,这些模型只会变得更大。

虽然这对数据中心的电力消耗来说不是好消息,但对其对水的依赖来说可能并非如此。至少,不一定是这样。

首先,在有人留言指出明显的问题前,我们先澄清一下。数据中心并没有真正消耗水。真正问题在于水资源被从当地环境中抽取,却没有回归到原本的水源。其次,无论是否与AI相关,IT基础设施本身并不是耗水的元凶。

即使采用液冷,这些系统通常也是封闭回路,在正常运行下几乎不会损失任何明显数量的液体。实际上大量消耗水资源的是位元仓的空气处理器,通常称为蒸发式冷却器或沼泽冷却器,用于防止这些系统过热。

然而,重要的是要注意,这是一个设计选择,蒸发式冷却器并非在每个设施中都被使用。如果Meta或Amazon在你家后院设立AI数据中心,它们会对你当地的电网造成压力,但这并不意味着它们会像Google在俄勒冈州The Dalles那样吸干你所在城镇四分之一的供水。

在较寒冷的气候下,干式冷却器和所谓的“免费冷却”就足够了,而在较热、容易干旱的地区,数据中心运营商选择使用基于制冷剂的系统并不罕见。据我们所知,这正是微软在其位于亚利桑那州固特异市的数据中心开发项目中所做的,尽管这是在与该市发生废水纠纷之后才做的。

虽然有蒸发式冷却的替代方案,但许多方案都会导致更高的电力消耗,而电力供应已经短缺,正如CBRE最近报道的那样。

虽然对于现有的数据中心设施我们能做的有限,但在新建数据中心时,决定是否采用蒸发式冷却最终还是归结于贪婪,或者用政治正确的话来说,资本主义。

特别是对于超大规模企业来说,一切最终都归结于利润率。如果你能以比竞争对手便宜5%或更有效率的方式做事,你就能赚取更多的利润,或者削弱他们并赢得他们的客户群。而水恰好比其他替代技术更有效地从空气中带走热量。这意味着更低的电力成本,或者能够在电力受限的地区建造更大、更密集的设施。

即使是工业用电价格,电费累积的速度也很快。因此,在适合使用蒸发式冷却器的市场中,这项技术提供了竞争优势。

还可以提出这样的论点:如果蒸发式冷却器的耗水量意味着可以减少燃烧化石燃料来维持电力供应,那么这种权衡是值得的,但这在很大程度上取决于地点。蒸发式冷却的本质意味着它们在干旱地区最有效,而那里的水资源已经很稀缺。

最终,它归结为这一点:你可以选择使用更多的电力或消耗更多的水。数据中心运营商在选择冷却方式时,会在电力消耗和水资源消耗之间进行权衡。如果水资源比电力便宜,而且供应充足,他们很可能会选择消耗更多的水来进行冷却,以节省电力成本。

然而,这可能正在改变。AI创新的步伐看起来不会很快放缓。在这种气候下,我们看到芯片变得越来越热,超过了一千瓦的标记,并推动了向液体冷却的转变。

但是,这种情况可能正在改变。AI技术的快速发展导致芯片功耗和发热量不断增加,传统的空气冷却方式已经难以满足需求,因此业界正在转向更高效的液体冷却技术。

我们在GTC增至到的Nvidia的Grace Blackwell Superchips额定功率为2700 W,其中两个设计为适合单个RU机箱。为了适应这种令人难以置信的密集封装,Nvidia毫不意外地选择了直接液体冷却(DLC)。

虽然直接液体冷却技术(DLC)在运营效率方面可能更好——它比使用风扇散热更节能——但它也给数据中心运营商带来了重大难题,因为许多旧设施无法轻易进行改造以适应这项技术。

虽然液体冷却技术的普及对某些人来说是个头痛的问题,但讽刺的是,从长远来看,它有可能减少水的消耗。这是因为液体冷却具有较高的热传导系数,允许使用干式冷却器,其工作原理有点像汽车的散热器,但规模更大。

在这些情况下,还存在热能再利用的潜力。在SC23上提出的一个思想实验中,预估训练一个GPT-3大小的模型可以产生足够的热量来支持大约4.6个温室,并种植超过一百万个番茄。我们也看到过数据中心为区域供热网络做出贡献的其他例子。

然而,在部署足够数量的液冷系统之前,我们可能会继续看到关于数据中心用水量的头条新闻,无论好坏。

0 阅读:7

逢纪说科技

简介:感谢大家的关注