据国际能源署称,全球数据中心目前约占用电量的1%至1.5%。到2025年,在全球数据中心用电量中,人工智能业务的占比,将从2%增至10%。
研究显示,训练GPT-3所需的水量,能够填满一个核反应堆的冷却塔。ChatGPT(在GPT-3推出之后)每与用户交流25到50个问题,就得“喝下”一瓶500毫升的水来降温。
最新研究表明,到2027年,生成式人工智能所消耗的能源,可满足荷兰这样一个国家一年的需求,即约85-134太瓦时(TWh)。
大语言模型也是如此。它对电能和冷却水的需求,正造成越来越严重的环境问题。波士顿咨询集团曾发布报告称,到2030年底,仅美国数据中心的用电量,就将是2022年的三倍。
据报道,全球数据中心的耗电量,已从十年前的100亿瓦增加到如今的1000亿瓦水平。ChatGPT聊天机器人每天耗电超过50万度,用于处理约2亿个用户请求,相当于美国家庭每天用电量的1.7万多倍。据OpenAI公司称,他们在ChatGPT上,每天花费高达70万美元。
比如,硅片工艺需要“超纯水”清洗,生产一个2克重的芯片,大约需要32公斤水。制造8寸晶圆,每小时耗水约250吨,制造12英寸晶圆,每小时耗水可达500吨。
不过,上述方法总是会带来新的问题,目前国内数据中心的用水,主要还是用自来水,近几年政府更鼓励数据中心企业使用中水(循环再利用的水)。
能量无法创造也无法消灭,它只能从一种形式转化成另一种形式。对计算机来说,最主要的能量转化方式,就是从电能转化成热能。
谷歌发布的2023年环境报告显示,公司前一年的用水量同比增加20%,达到56亿加仑,其中绝大部分用于为数据中心散热。除了谷歌,另一个巨头Meta在美国亚利桑那州建了数据中心,仅2022年用水量就超过260万立方米。
正在大力开发人工智能的微软,也在最新的环境报告中透露,2022年公司用水量同比前一年激增34%,达到640万立方米,比2500个奥林匹克标准游泳池的水量还多。
在OpenAI训练大语言模型GPT-4时,完成一次训练需要约三个月时间,使用大约25000块英伟达A100 GPU。仅仅是这些GPU(图形处理器),一次训练就要用2.4亿度电。这些电能几乎全部转化成了热能,可以将大约200万立方米冰水——大概是1000个奥运会标准游泳池的水量——加热到沸腾。
这些数据中心由大量服务器组成,服务器消耗的电能,绝大部分转化成热能,最后通过水冷系统释放出来。可以说,AI的物理硬件,是个巨大的“电热水器”。
在2023年的达沃斯世界经济论坛上,OpenAI的CEO山姆·阿尔特曼认为,核聚变可能是能源的发展方向,但要开发出真正可用的核聚变技术,可能还需要一些时间。
生成式AI,除了“吃电,还得喝水”——用水量也是个惊人数字。因为要训练这些AI,就得有强大的算力中心,而算力中心要运转,就得有散热系统,这都得用到水。
以谷歌为例,每年用于人工智能训练的电量为23亿度,相当于美国一个州首府所有家庭一年的用电量。即使在训练完成后,这些人工智能仍需大量计算能力运行,并耗费大量能源。
不过,蓬勃发展的AI背后,是算力;而算力背后则是能耗。人工智能飞速发展的背后,其能源消耗问题日益凸显,成为全球关注的焦点。
如何让散失的热能不至于白白浪费?最容易实现的,是热回收技术。即将数据中心回收的热量,用于提供民用热水,冬季则提供民用采暖。现在有些企业已着手于回收废热再利用,比如阿里巴巴千岛湖数据中心等。
节流方面,可以通过优化数据中心的设计和管理,提高电源使用效率。国内大厂也纷纷给出解决方案。比如腾讯,组建了专门的绿色能源团队,应用自然冷却、液冷、余热回收等新兴节能技术,降低数据中心能耗。华为、京东、亚马逊等也纷纷入局智慧能源领域。
彩名堂计划电脑版由美国OpenAI公司最新推出的视频生成工具Sora,自发布以来,便成为人工智能界最火爆的“网红”。该公司上一个全网刷屏的产品——ChatGPT,在推出仅两个月后,就达到1亿月活跃用户数。
耗水问题已成为制约数据中心快速发展的因素之一。为节约宝贵的自来水资源,很多企业尝试用各种方法为数据中心散热,例如,微软曾尝试部署海下数据中心,Facebook数据中心选址北极圈附近,阿里云千岛湖数据中心使用深层湖水制冷。
科学家预计,到2027年,全球人工智能可能需要4.2亿—66亿立方米的清洁淡水,这比4-6个丹麦或一半英国的年取水总量还要多。