數據中心領域,歷來都有“力大磚飛”的傳統,因此在前幾年算力相對匱乏的時候,在CPU上增加核心數量幾乎成為了芯片廠商的共識,但隨著處理器核心數的不斷增加,并一舉破百之后,如何為處理器提供足夠的內存帶寬成為了新的挑戰,畢竟處理器核心數量的增長速度要明顯高于內存帶寬的提升,一旦核心數過多,每個核心能夠分配到的內存帶寬就會變少。
特別是在天氣建模、計算流體動力學這些特定的AI場景中,往往需要運行大量的工作負載,而處理器核心與內存帶寬之間的失衡則會導致計算瓶頸,而MRDIMM的出現,則為解決這一問題提供了新的思路。
MRDIMM由英特爾DCAI內存開發資深首席工程師George Vergis于2018年開始研發,其設計初衷是通過現有的DDR5DIMM技術實現帶寬翻倍,與標準的DDR5 DIMM相比,MRDIMM采用創新的方法,通過在DRAM模塊上放置一個小型接口芯片,也就是多路復用器(Mux),讓數據可以在同一個時刻跨兩個內存陣列進行傳輸,由于多路復用緩沖器整合了每個MRDIMM的電力負載,使得接口能夠運行得比RDIMM更快,并且由于能夠同時并行訪問兩個內存陣列,帶寬也實現了翻倍。
經過三年的努力,MRDIMM技術于2021年完成原型概念驗證,并在2022年底被正式提交給JEDEC作為新的開放標準。而在今年,英特爾首次將這項技術應用到了英特爾至強6性能核處理器上。
作為一款面向AI、數據分析、科學計算等計算密集型業務推出的數據中心CPU產品,至強6性能核處理器最高可配備128個核心,并從PCIe通道、L3緩存等一系列專門針對高性能的場景做了很多擴展,同時在英特爾高級矩陣擴展AMX加速器的賦能下,至強6性能核處理器可以更好地支持大語言模型、深度學習和機器學習的相關模型推理,這使得其成為了當下最佳的AI頭節點處理器。
在內存帶寬方面,已上市的至強6900P系列處理器擁有12通道的內存,內存規格支持DDR5 6400或者MRDIMM 8800,相比上一代實現了大幅提升,這使得至強6900P系列處理器的每個核心擁有了更加充裕的內存帶寬,更加有利于核心性能的釋放,從而在生成式AI、深度學習、機器學習、推理訓練等場景中獲得更好的表現。
英特爾技術專家表示,雖然MRDIMM從原型設計到正式發布已經很多年了,但之所以在至強6這一代才開始支持MRDIMM技術,主要原因是基于性能和收益的平衡,并且還能和現有的DDR5實現兼容。
事實上,MRDIMM的突出優勢之一正是其兼容性,通過采用與常規RDIMM相同的連接器和外形規格,使小型多路復用芯片也可適配之前模塊上的空余位,因此無需對主板做任何更改,這意味著服務器制造商可以輕松集成MRDIMM,而無需對其設計進行任何調整,此外,由于MRDIMM具備與RDIMM相同的糾錯及可靠性、可用性和可維護性(RAS)功能,無論數據緩沖區中產生怎樣的獨立多路復用請求,都可以保持數據的完整性,因此數據中心客戶可以在不對其基礎設施或軟件進行任何調整的情況下體驗MRDIMM帶來的全新性能。
在當下的服務器領域,功耗一直是個不可小覷的問題,和普通的RDIMM相比,MRDIMM也會帶來一定的功耗提升,且這種提升與帶寬和容量基本成正比,隨著CPU、GPU等核心部件的功耗提升越來越明顯,包括浪潮信息、新華三、超聚變、聯想等公司在內的主流液冷服務器已經開始考慮內存部分的散熱需求,會針對所有關鍵散熱部件進行統一設計,從而為服務器整機帶來更低的PUE。
根據JEDEC的路線圖,預計在未來,MRDIMM將在8800MT/s的基礎上實現翻倍,從而更好地滿足下一代處理器的卓越性能,隨著核數的增多、處理能力和主頻的提升,數據中心也會對打破“內存墻”、突破內存的容量和性能問題提出更高的要求,而MRDIMM則為數據中心的算力提升提供了新的可能性,有望成為推動科學計算和AI等領域發展的關鍵技術之一,為數字化轉型注入強大動力。
(9226693)