2023年的ChatGPT,到2024年的Sora,AI和大模型正以不可思議的發展速度顛覆著業界的認知,但大模型的火熱登場,也進一步引爆了智能算力的需求。傳統算力時代,算力需求每18-20個月翻一倍,在深度學習出現之后,算力需求每6個月翻一倍,而到了大模型時代,對智能算力的需求幾乎是每年數百倍的增長。
在此過程中,可以看到數據中心的機柜功率越來越大,能耗越來越高,這也意味著數據中心行業所面臨的“雙碳”任務更加艱巨與緊迫,同樣更對數據中心的“節能減排”提出了更高的要求。
也正因此,液冷成為了未來數據中心供冷的“必選題”,市場熱度逐步增加。根據IDC最新發布的《中國半年度液冷服務器市場(2024上半年)跟蹤》報告顯示,中國液冷服務器市場在2024上半年繼續保持快速增長,市場規模達到12.6億美元,與2023年同期相比增長98.3%。IDC預計,2023-2028年,中國液冷服務器市場年復合增長率將達到47.6%,2028年市場規模將達到102億美元。

在此背景下,聯想近期面向本地用戶重磅發布了“聯想問天海神”液冷品牌,該品牌基于聯想20年來領先的液冷技術打造,更加聚焦國內市場,希望能夠為本土客戶提供符合國家標準,匹配中國數據中心設計、兼容本地處理器和軟件生態的液冷解決方案,助力客戶加速綠色升級。
客觀地說,液冷技術從最初應用于科學計算領域,經過不斷地發展和演進,特別是在數據中心能耗攀升以及“雙碳”的需求牽引下,開始進入到更多的行業場景,而此時聯想推出“聯想問天海神”液冷品牌,以全場景液冷產品線,完善的液冷方案組合以及大規模高質量的交付經驗服務中國用戶,不僅代表著聯想已經站在了液冷技術創新的主航道,更預示著數據中心將加速邁入“液冷”新時代。
01.
面向中國市場,
提供全場景液冷產品線
事實上,液冷并不是一個“新名詞”,其是在解決數據中心服務器高密度部署出現的散熱難題推出的一項技術,誕生于上個世紀80年代,但之前主要是一些超大規模互聯網用戶和高功耗計算用戶在應用,其產業爆發的“拐點”發生在最近兩三年。

一方面,從技術演進看,隨著近兩年智算中心的爆發,更高功耗的GPU成為了智算型服務器中的最主要功耗貢獻者,尤其在訓練服務器中,單服務器內多顆大功耗的GPU可占據整體服務器的80%—90%功耗。因此,如何降低服務器內部CPU+CPU的功耗變得日趨嚴峻。
另一方面,從國家政策看,為了降低數據中心能耗、助力實現雙碳目標,國家對于數據中心的PUE指標要求逐年提升。《數據中心綠色低碳發展專項行動計劃》中就提出,到2025年底,新建及改擴建大型和超大型數據中心的PUE指標要降至1.25以內,國家樞紐節點數據中心項目的PUE不得高于1.2 。
據聯想中國基礎設施業務群服務器產品部總經理周韜介紹,聯想在液冷技術領域有著深厚的積累,其中自主研發的聯想海神(Neptune)液冷技術已經演進到第六代,不僅匯集了材料學、流體力學、傳熱學等多學科的科研結晶,能夠實現對關鍵部件100%全覆蓋液冷散熱設計,同時還面向中國市場推出了全場景液冷產品線,覆蓋了從通用計算、智能計算到科學計算的全場景算力。

一是,在智能計算場景,全新升級的聯想問天WA7880a G3聚焦于多元算力、靈活配置與節能高效三大方向,作為國產首款支持OAM 2.0模組的服務器,它可兼容國內主流GPU廠商的OAM標準GPU,展現了強大的生態兼容性與前瞻性。在高效節能方面,該服務器通過部署聯想問天海神液冷方案,結合獨立風道設計,有效降低了運行時的能耗與熱量積聚,為用戶打造了一個既環保又高效的AI算力中心。
二是,在科學計算場景,聯想ThinkSystem SC750 V4 Neptune聯手聯想問天海神液冷方案,可以實現服務器100%的全覆蓋冷板式液冷,從而有效降低整個數據中心的PUE,實現零噪音數據中心。該產品配合第六代垂直液冷產品聯想ThinkSystem N1380 Neptune刀箱可實現整機柜交付,單機柜總功率可達100KW以上,在緊湊的封裝中實現萬億參數的HPC和AI計算。
除此之外,聯想ThinkSystem SD650 V3服務器,通過部署聯想問天海神液冷方案,以及通過整機柜全水冷無風扇設計,也使得服務器散熱效率高達98%,并實現60%以上的余熱回收再利用,降低40%的能耗,讓數據中心PUE可降至1.1。
三是,在通用計算場景,面向應用負載更加廣泛的通用計算領域,聯想推出針對大中型企業和云服務提供商的聯想問天WR5220 G5通用服務器,支持關鍵部件如CPU、MEM及GPU等液冷散熱方案。

此外,針對內存液冷散熱,聯想還創新打造“百變精硅”等多項創新技術,采用定制的軟硅材料制作成1.27mm雙層超薄導熱墊的內存液冷模組,恰到好處的軟硅壓縮比既保證了與內存的充分接觸和熱傳導效果,同時又確保在插拔安裝過程中不會損傷內存且每根內存可獨立操作;通過精確到0.01毫米級的軟硅厚度調試與測試,不但保證了軟硅與內存顆粒的接觸縫隙,還允許在19英寸服務器內排列32個DIMM的結構。
周韜進一步表示:“聯想服務器產品線實際上從G3這一代就已經有部分產品開始支持液冷設計,甚至是全液冷的覆蓋;而到了G5這一代,則基本上可以做到全線產品都會支持液冷設計。未來兩年,無論是不同的CPU處理器,還是不同的GPU處理器,以及不同的計算應用場景,聯想都會實現液冷產品的全方位布局。”
由此可見,在當前數據中心走向液冷時代的重要關口,聯想“與時俱進”的將液冷技術標準化和產品化,并面向中國市場打造出了全場景的液冷產品線,不僅為數據中心帶來了更加高效和豐富的液冷產品線,更為中國用戶提供了一個面向數據中心綠色升級的最佳選項。
02.
打造中國方案,
構建完善液冷方案組合
我們常說:“機遇總是留給最有準備的人。”
那么,為什么聯想能夠打造出全場景的液冷產品線呢?——背后的關鍵原因,既源于聯想過去多年來持之以恒在液冷技術進行投入研發的韌性,更源于聯想一直致力于構建技術領先、質量可靠、服務完善的液冷方案組合,這正是聯想能夠確保數據中心實現綠色高效與穩定運行的底蘊與底氣。
對此,聯想中國基礎設施業務群服務器研發總監李鑫表示,作為液冷技術的最早探索者之一,在近十余年中,通過不斷的演進,結合超過七萬節點的液冷服務器集群交付項目經驗,錘煉出聯想液冷方案最佳實踐,并一代又一代的融入到聯想企業級液冷產品、方案和服務中,沉淀出了聯想企業級液冷全景圖。也正因此,無論是在液冷技術、質量安全保障和服務保障方面,聯想都有著深厚積累以及豐富的實踐,具體來看:

首先,液冷技術創新方面,在冷卻液領域,聯想問天海神液冷解決方案,創新性地采用成本低、無污染的去離子水作為熱量傳輸介質,通過出色的并行水回路設計及微通道散熱器設計,可降低CPU、GPU等部件的性能抖動,Linpack效率可提升5%-10%;在全冷板設計領域,聯想問天海神液冷解決方案實現對CPU、GPU、內存、IO設備及電源等關鍵部件100%全覆蓋液冷散熱設計,散熱系統機械故障率接近于0,大幅提高了系統的可靠性,且標準機架服務器可做到內存32根全液冷板,采用VR+CPU+DIMM冷板方案,液冷覆蓋率居行業前列。
此外,在冷管設計上,全部采用預制醫用304不銹鋼管道,耐腐蝕性強且使用壽命長,有效防止表面氧化和腐蝕,適用于潮濕和化學腐蝕環境。二次側預制冷管設計,無需焊接,無需現場加工,保障施工清潔度。除此之外,為了最大限度降低漏液帶來的風險,聯想問天海神液冷方案通過冷板漏液感應線能夠實時監測服務器機柜內的冷板表面及鏈接管道是否有液體泄漏。這一創新技術能夠迅速發現問題,提前發出預警,從而顯著降低業務中斷的可能性,并大幅提升系統的穩定性和可靠性。
更為重要的是,聯想問天海神液冷方案還支持“600W CPU +1200W GPU”散熱,整體PUE指標小于1.1,且熱量回收超80%,可將數據中心功耗降低高達40%,極大滿足國家對數據中心的“綠色低碳”要求。
其次,質量安全保障方面,聯想冷板式液冷服務器采用一體式冷板,冷板加工工藝和檢測方面有多重質量安全保障。最為典型的例子,就是焊膏改為一體成型焊片工藝,進一步提升焊接質量穩定及可靠性,焊著率提升到85%以上超出國標要求(國標為80%),依據實際應用要求增加最小焊縫管控并提升管控標準,焊接厚度>=1mm,保證無漏點。在基礎上,通過AI輔助檢測技術,還實現100%無損檢測,為整個液冷系統提供更加堅實的質量安全保障。
除了生產制程實施嚴苛,聯想冷板式液冷服務器在出貨前,其冷板組件還執行100%干燥并監測管路內部濕度,嚴格保證出貨質量;同時還給管路充氮,預打2個大氣壓氮氣,保證冷板組件管路內部維持在無氧環境無細菌滋生;而在大規模驗證方面,聯想問天海神液冷技術在中國客戶的上萬臺液冷服務器驗證中,三年來未發生任何漏液事件,真正實現了安全可靠“零風險”。
最后,服務保障方面,根據客戶的具體需求,聯想可提供定制化的聯想問天海神液冷部署解決方案,包括服務器選型、系統設計、安裝調試等全生命周期服務保障。此外,聯想問天海神液冷方案也支持節點交付、標準交付以及一體交付等。
不僅如此,聯想還提供專業的超算踏勘部署服務,該服務由原廠專業團隊實施交付,提供“交鑰匙”服務內容,針對HPC集群系統提供“一站式”無憂服務。同時,AI智算踏勘服務,同樣也可以可提供數據中心動環評估、空間承重評估、PUE評估等全方位勘測,讓客戶的數據中心更好的適配AI設備,最大程度發揮AI設備的計算能力。
