(原标题:曙光数创副总裁兼CTO张鹏解密曙光数创相变浸没液冷系统6大关键技术)
近日,2024中国智算中心全栈技术大会、第5届中国数据中心绿色能源大会暨第10届中国(上海)国际数据中心产业展览会 ”在上海新国际博览中心盛大开幕,液冷数据中心技术的领航者之一——曙光数创(872808.BJ),受邀参此盛会。
会上,曙光数创副总裁兼CTO张鹏对曙光数创相变浸没液冷系统的浸没冷媒新材料,材料兼容性技术,高速信号衰减抑制技术,结构密封与机电转接,高效相变换热技术,相变换热自动控制技术等6大关键技术进行了全面剖析,揭秘了这一前沿技术的关键所在。
关键技术1—浸没冷媒新材料:联合研发 自主可控
冷媒是实现高效浸没冷却技术的重要材料,液冷系统的换热效果、材料与信号兼容性、安全性等都与冷媒自身的物性特征紧密相关。冷媒作为高效浸没液体冷却技术的换热介质,须具有高绝缘、低沸点、大潜热、稳定性高、低粘度、安全性、以及环境友好(无臭氧破坏、温室效应低)等诸多特点,这对浸没冷媒的筛选和测试工作带来很大挑战。曙光数创浸没液冷所使用的冷媒是曙光数创与中国科学院某研究所联合研发的产品,冷媒的整个研发过程科学严谨,技术先进,同时符合国家政策的要求,绿色环保。与国外同类产品相比,曙光数创冷媒在性能和成本方面具有比较明显的优势。从2017年到2024年,经过三代冷媒产品的研发迭代,曙光数创的浸没冷媒实现了技术自主可控、成本可控、性能优越和安全环保。
关键技术2—材料兼容性技术:构建兼容性数据库
若将服务器浸没在冷媒中,须考虑服务器的电子元器件、结构件、密封件、焊料等所有涉液部件与冷媒的兼容性问题,确保其与冷媒长期兼容,不影响液冷服务器的长期稳定运行。曙光数创的研发团队自2012年就开始了冷媒相关兼容性研究,搭建了专用兼容性测试平台,选出了适合浸没液冷的冷媒,并与几十种电子元器件进行了数万小时的材料相容性测试,建立了材料"白名单"和"黑名单",并不断迭代出适用于全浸式液体相变冷却技术的完善材料兼容性数据库,在为该技术在电子计算机领域的全面推广应用打下坚实理论基础的同时,还在实践中摸索出一套自主高效的冷媒筛选及材料兼容性测试方法,为设计和材料选择提供了明确的依据。
关键技术3—高速信号衰减抑制技术:信号完整性的保障
由于冷媒的介电常数与空气不同,信号在浸没环境中传输路径的分布电容增加,导致高频信号衰减。这给主板设计和信号完整性 (SI: Signal Integrity) 带了巨大挑战。主板上的CPU、GPU、内存、PCIe、高速网络的信号速率均高于1Gbps,此类信号在全浸环境下电信号特征会出现明显的失真,严重影响信号可靠传输。曙光数创通过研究浸没环境下的高速信号衰减规律,针对关键高速信号传输进行了优化,形成了一整套针对浸没环境的高速信号设计规范,包含主板Layout规则、板卡材料要求、测试方法等多方面内容。
关键技术4—结构密封与机电转接:实现气液循环的密封解决方案
全浸式液体相变冷却技术要求在密封环境中进行冷媒的气液两相循环,以避免冷媒的损失。曙光数创通过开发适用于液体、气体、电气和信号的连接器,使这些连接器能够在密封环境中实现内部和外部的连通,同时保持良好的密封性能。这种结构密封技术对于保持系统的长期稳定运行至关重要。
关键技术5—高效相变换热技术:液冷的创新应用
相变换热技术通过强化沸腾和强化冷凝过程来提高冷却效率。曙光数创聚焦于散热器表面处理工艺的创新。通过微纳复合强化沸腾结构的引入,散热器表面被赋予了前所未有的微观形态,从而显著增加了气化核心的数量。这一创新设计,促使沸腾过程在更低的过热温度下发生,极大地提高了热传导效率。气泡在微纳复合结构上形成并迅速脱离,加速了热量的散发,确保了液冷系统的高效运行。
强化冷凝传热,则是通过精心设计的微纳复合翅片锯齿状结构来实现的。这一独特的结构设计,旨在扰动冷凝液的流动状态,打破液膜表面张力的平衡。在微纳复合翅片的作用下,冷凝液的流动状态变得更为复杂,促使液膜在重力作用下快速脱离冷凝管,大大加快了冷凝过程。这种创新的冷凝机制,不仅提高了热交换效率,还减少了冷凝液的滞留时间,从而降低了能耗,提升了整体系统的冷却效能。
通过强化沸腾和强化冷凝两项技术的协同作用,曙光数创的液冷系统实现了对传统冷却方式的超越,为数据中心的高效、节能冷却提供了全新的解决方案。
关键技术6—相变换热自动控制技术:智能化的系统管理
全浸式液体相变服务器,作为数据中心绿色转型的关键技术之一,对供液流量、温度和系统压力的精准控制提出了极高的要求。任何细微的失控,都可能引发连锁反应,迅速导致芯片温度异常升高、服务器内部压力超标,甚至引发设备干烧损坏的严重后果。因此,寻找最适宜的控制策略,是确保其卓越的性能和系统可靠性亟待攻克的难题。
面对全浸式液体相变服务器中固有的复杂非线性特性,传统的微分方程建模方法逐渐显露出局限性。曙光数创凭借其深厚的研发底蕴,引入了神经网络等前沿技术,替代传统方法,对系统进行了深度建模。这一创新举措,不仅能够精准捕捉系统的动态行为,还为控制器设计和参数优化提供了强大的仿真验证环境。通过这一系列复杂而精细的建模工作,曙光数创得以在虚拟空间中反复试验和优化,确保了控制策略的高效性和可靠性。
为了使控制系统能够稳定、快速且准确地响应负载变化,曙光数创采用了串级双层闭环控制结构,并巧妙地融入了基于模型预测的前馈控制环节。这一控制架构,不仅增强了系统的鲁棒性和适应性,还显著提高了其动态响应速度。无论是在负载突然激增还是骤降的情况下,控制系统都能够迅速做出调整,确保服务器内部的温度和压力维持在安全范围内,有效避免了因响应迟缓而可能导致的一系列问题。这种前瞻性与创新性的控制策略,充分体现了曙光数创在液冷技术软件控制方面的深刻洞察和卓越能力。
业内人士指出,上述每一项技术难题的攻克,都彰显了曙光数创在液冷领域的深厚技术底蕴,也从侧面反映了其在推动数据中心绿色转型和能效提升方面的重要贡献。
作为新一代数据中心冷却技术领先的整体解决方案和全生命周期服务供应商,曙光数创以浸没相变液冷的高效冷却技术为核心竞争力,是液冷数据中心,尤其是浸没式液冷数据中心的最大实践者。
全景网注意到,曙光数创自2011年开始启动液冷相关技术的研究,截至目前,曙光数创已累计建设超过260MW液冷数据中心,涉及科研、能源、政府、金融、互联网、运营商等多个行业,在浸没液冷技术和项目实践经验方面都有丰富且精深的积累。
据悉,该项技术目前处于全球先进水平,已在重庆、江苏、山西、河北、浙江等多地完成浸没相变数据中心建设,是国内唯一实现浸没相变液冷技术大规模商业化部署的企业。
根据赛迪顾问《2023中国液冷应用市场研究报告》,2021年至2023年上半年,曙光数创以平均58.8%的市场份额,位列中国液冷数据中心基础设施市场部署规模第一,多年稳居行业头名。
展望未来,曙光数创表示,公司将继续秉承创新精神,深耕液冷技术,不断探索和实践,致力于为行业带来更加高效、可靠、环保的冷却解决方案,助力数据中心行业向更绿色、更智能的方向发展,让我们共同期待,在AI赋能的新时代,共同构建一个可持续发展的数字化未来。(全景网)