设为首页 | 收藏本站
 

面向GPU高功率未来,相变浸没式液冷做好准备了吗?


“2022年,液冷渗透率约3%-5%,2023年大概8%-10%,但接下来增长趋势会非常惊人,我们预计会有30%-40%的增长率。”曙光数创副总裁兼CTO张鹏博士日前接受采访时对液冷市场做出判断,并进一步指出,目前冷板式的技术与产业链已经成熟,是应用的主流,与浸没式的比例约为9:1。但伴随智算需求的提升,数据中心设计、建设的改变,GPU应用增多后,这一比例将发生改变,浸没式中的相变浸没将进一步发展。

曙光数创副总裁兼CTO张鹏博士

为什么相变浸没式液冷是未来

据《全球数字经济白皮书(2024年)》,截至目前,全球人工智能大模型数量为1328个(包含同一企业、同一模型的不同参数版本),中国大模型数量位居第二位,占比为36%,约478个。这需要海量智算的支撑,液冷也随之爆发,张鹏指出,液冷的快速增长主要是三个原因。

一是降低PUE与节能减碳的要求,多项政策在推进数据中心降低PUE,部分还明确了液冷占比,如《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》指出,到2025年,上海市新建智算中心PUE值达到1.25以下,液冷机柜数量占比超过50%。液冷也为余热回收的利用提供了更高的可能,液冷条件下的余热能量更高,为就近的居民用热乃至农业用热提供新思路。

二是芯片功率提高,液冷能够更好地满足高散热需求。同体积液体带走的热量是同体积空气的3000倍以上,能够高效降温。

三是液冷能够更充分地释放芯片计算潜能的需要,这也是尤为重要的一点。如果制冷能力不足,为了安全稳定的运行,GPU需要降频,而这就影响了计算能力,液冷可高效地解决这一问题,确保芯片计算能力的全火力输出。

相变浸没式液冷被认为能够从中脱颖而出便是主要源于更高的散热需求,是市场的需求与选择。张鹏指出,目前数据中心建设还是以CPU为主,CPU与GPU的比例约8:2,但是未来可能会变成6:4或5:5。基于智算需求,以CPU为主的新建数据中心,机柜设计功率建议要到20KW;伴随GPU比例提升,机柜设计功率则要达到60-100千瓦乃至更高。

换句话说,伴随GPU应用增多,数据中心功率将持续提升,这就要求更高的散热效率。据张鹏介绍,与冷板式与单相浸没式相比,相变浸没式制冷效率更高。如同当前风冷占比减少,冷板式占比提高一样,相变浸没式也将实现进一步发展,这是散热的需要,是保证芯片计算力输出的需要。

同时张鹏提到,不论是冷板式还是相变浸没式都是因市场而发展,但液冷与风冷不是非黑即白的关系。风冷有其适用场景,液冷占整个数据中心散热市场的60%便可能会达到极限,如金融对安全性更为看中,功率却不高,便可以利用风冷散热。

相变浸没式液冷是否已准备就绪

技术的大规模应用需要两个基本支撑,一是成熟的技术,二是产业化生产能力。目前,国内唯一实现全浸式液体相变冷却大规模商业化部署的企业是曙光数创,其在重庆和多个东部一二线城市均有相变浸没式数据中心的建设实践。以此来看,相变浸没式已基本满足技术与产业化两项条件。

技术方面,据张鹏介绍,曙光数创相变浸没液冷系统在6大关键技术实现了创新突破。具体来看,在浸没冷媒新材料上实现了联合研发、自主可控;材料兼容性技术上,构建了兼容性数据库;高速信号衰减抑制技术上,能提供信号完整性的保障;结构密封与机电转接上,实现了气液循环的密封解决方案;高效相变换热技术上,完成了液冷的创新应用;相变换热自动控制技术上,可进行智能化系统管理。

曙光数创相变浸没液冷系统关键技术

通过对这6项技术的攻克,曙光数创实现了产品的持续更新和迭代升级,为相变浸没式的应用提供了技术基础。

产业化方面,曙光数创不断进行优化,以提升生产效率,实现降本增效,推动相变浸没的应用。如曙光数创在山东青岛建设投产了目前我国规模最大的液冷数据中心全链条产业创新基地,该基地囊括研发、生产和保障三大功能区,拥有七大研发创新实验室和四条先进生产线,实现专业的全链条、一站式系统解决方案的创新研发和生产,能够有效降本增效,提升交付能力,提高保密性,推进生产发展。

技术与产业化能力的发展,为相变浸没式的应用推广奠定了基石。除此之外,也应认识到相变浸没式的发展目前依旧存在诸多挑战,需要加大投入,这也是曙光数创能够保持领先并不断突破的重要原因。据根据财报来看,2023年研发投入共计6825.33万元,2024年第一季度研发费用总额超1440万元,相较于2023年第一季度同比增长超过4%。这将有效促进相变浸没式的技术革新与商业化进程,为满足未来数据中心更高的散热需求做好准备。

当前数据中心中依旧是CPU为主,为应对智算需求,功率便需要达到20KW,伴随GPU比例的提升,功率将极大提高,且未来将进一步升高,面对这一情况,相变浸没式应用将增多。目前,曙光数创已经实现了6项核心技术的突破,产业化能力在快速提高,投入也将持续加大,这为相变浸没式的应用打下了基础,将为未来算力的发展提供有效助力。