当AI写作、创作艺术品和撰写诗歌都能媲美甚至超越普通人水平时,有人兴奋不已,也有人忧心忡忡。
对于生成式AI可能带来的变化,人们的态度各有不同,但推动这一技术发展的研究人员和企业都面临一个共同的问题:大模型所需的大算力需求如何解决其巨大的能耗问题?
以全球火爆的OpenAI公司的ChatGPT为例,微软为了满足OpenAI的GPT-3模型训练需要,特别推出了一个拥有28.5万个CPU核心、1万个GPU超级计算机。如此庞大的CPU和GPU配置带来了高昂的芯片采购与运营成本。
据国盛证券报告估算,GPT-3每次训练所需成本达140万美元。若按2023年1月访客数量1300万计算,每日电费在5万美元左右。
数据中心能耗问题成为了云计算服务商面临的一个新挑战。为了解决这个问题,无论是微软Azure还是阿里云,都已经将数据中心服务器采用“泡澡”方式进行散热,以提升IDC能源效率。
“我认为ChatGPT会加速液冷技术发展,现在液冷几乎已经成为潮流。”英特尔市场营销集团副总裁兼中国区销售总经理庄秉翰在2023英特尔可持续发展高峰论坛上表示。
服务器「泡澡」要成潮流
服务器“泡澡”是一种比喻,实际上代表的是服务器使用浸没式液冷技术中的散热方式,这一技术包括了冷板、喷淋及浸没式,并非新兴技术,但业界应用率并不高。
主要原因是国内许多冷板液冷设计缺乏统一标准,使得每个厂家设计存在差异,加重了系统设计与验证成本,因此对最终用户而言方案较贵。英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立认为。
除了技术标准外,应用也是影响液冷普及程度的一个因素。
“高性能应用环节才需要使用液冷,但是大量应用并非那么功耗密集,而且国家提出的‘双碳’战略之前,没有那么紧迫或必要。”宁畅总裁秦晓宁说,“现在情况不同,CPU功耗可能达到270W或300W,而未来可能更高;GPU目前400W至500W,不久后也必须考虑到利用液冷技术。”
更进一步讨论,大规模算力需求也是促使客户从风冷转向更多节能型水泵制定的关键因素之一。
包括ChatGPT等应用带来的快速算力增长,是促使大部分客户迅速从风扇散热转向更节能且先进水泵制定的重要原因。此举不仅关乎节约多少电,还涉及空间浪费管理以及数据中心运营费用增加。这驱使更多中国客户在考量更新整体设计时,将注意力集中于更加节能且先进水泵制定来解决能源消耗与平衡问题。
当用户需求激增→建立标准→实现规模效应→整体成本自然下降形成循环之后,可以加速推动传统数据中心向新型节能型转变。当这些步骤完成后,可以自然地降低整个产业部署成本。刘宏程进一步指出。
随着时间推移,从2017年开始全国共计520余万个基架进入部署,并保持30%年的复合增长率。而这期间全国用电量占比逐渐升至2.6%,预计未来还会继续增长。在面对能源挑战中政府指导单位发布了一系列政策指导行业发展,其中包含三个重点方向:规划、效率、高利用性。在《工业能效提升行动计划》中明确规定到2025年新建大型超大型数据中心PUE优于1.3。
PUE(Power Usage Effectiveness)是评估IDC能源效率指标,是通过IDC全负荷功率除以IT设备全负荷功率得出。这直接关系到不同的散热模式对于PUE值影响。如果采用风扇散热则PUE可达1.4至1.5;而如果使用水泵制定,则PUE可以接近1.1。
破解大规模应用难题
处理器层面的挑战主要是科技挑战,对于创新强调如英特尔来说相对易控今年初发布的英特尔至强可扩展处理器,在深层环节采纳90%可再生电源用于生产过程中减少环境足迹并提高资源利用效率
服务器层面的挑战则涉及两方面:科技和经济性质的问题。一旦发生管道或任何温媒介突然泄漏,以及电子器件受到损害该怎么办?这需要大量验证试验。这就是为什么我们以及其他业内领先伙伴一起做了非常多实验。但很多厂家提供各种方案,我们需要进行广泛测试去证明这些应用在水泵制定中的温媒介安全使用以及不会影响工作性能和服务质量。不过根据最新研发成果,如英国三星提供的一些解决方案,如限流板等方法可以有效降低整个部件级别的消耗效果,使其符合绿色低碳要求
相比之下,经济性的障碍更加艰巨。一旦采纳这种新的设备结构,它们可能导致10-20%额外开支
尽管有一些产品支持无论何种厂家但由于没有统一规范,即便尺寸大小也不尽相同,这给用户造成了极大的困扰,因为即便到了他们机房里也无法直接安装或者调整。此处参考英国三星提供的一些关于此类问题详细说明
然而通过标准化能够显著降低产业门槛并促进普及化,让所有用户能够享受最新科技优势。不过目前仍然有存量市场存在提升能源效益的手段:
近期我们把绿色数据中心框架升级到了2.0版本,其中包含四个垂直领域——高能力、高功率密度、高智能基础设施材料循环,以及XPU/Server/Rack/Datacenter四个水平方向共13项关于减轻碳排放策略。此外智慧信息管理平台基于模块化组件构建,为数字基础设施提供灵活性,以适应不断变化环境同时确保最大限度地减少对环境影响