Intel Sapphire Rapids支持CXL,提升内存效率

关键字 :intelCXL内存

第四代服务器市场的x86处理器(包括代号Sapphire Rapids的第四代英特尔®至强®可扩展处理器)陆续发布并进入市场,PCIe 5.0终于有了广阔的舞台。虽然去年的消费类PC已经普遍可以提供PCIe 5.0插槽,但实际上并没有多少设备能够发挥新一代总线的价值,而对于数据中心市场,高性能计算卡、智能网卡、DPU等设备对于接口带宽可谓极度渴求,首先,第四代英特尔®至强®可扩展处理器支持CXL 1.1版本。这意味着在这一时期的平台上,主机级的CXL内存扩展,至于基于CXL的资源池化则还需要等待下一阶段的平台。目前话题度比较高的CXL设备主要是CXL内存、内存语义SSD。


解释一下内存语义SSD(Memory-Semantic SSD,简称MS-SSD):它是一种被主机视作内存的特殊SSD。传统的SSD是块设备(块语义),通过 PCIe 总线上的NVMe协议进行传输。如果传统SSD移植到CXL,则基于CXL.io——看协议的名字就很“外设”范。但是,如果是MS-SSD,则可以使用CXL.mem协议,在主机和软件看来,就好像它是内存一样。

CXL支持三种设备类型:

1.Type1支持CXL.cache和CXL.io 2.Type 2支持CXL.cache,CXL.mem和CXL.io;3. Type 3支持CXL.mem和CXL.io。

CXL Type 1设备的典型应用是网卡。这类设备强调缓存一致性,数据流可以选择任何排序,并允许实现无限数量的原子操作。这些操作只需要少量的缓存,可以很容易被主机跟踪。

2.CXL Type 2设备的典型应用是GPU、FPGA之类的加速器。Type 2设备除了一致性高速缓存外,还具有连接到设备内存的能力。这些设备的性能依赖于加速器和设备自有内存之间的巨大带宽。CXL的价值在于提高了主机内存和设备内存之间数据访问的效率,不论是主机内存将数据输入加速器,或是从加速器获取结果。PCIe虽然也具备DMA能力,但其并非为大数据流量优化,延迟比CXL大。图中的HDM是Host-managed Device Memory的缩写,意思是“主机管理的设备内存”。GPU卡之类设备上的内存,如果支持CXL一致的系统地址映射,即为HDM。与HDM相对的是传统的专用设备内存(Private Device Memory,PDM)。譬如传统的GPU卡上的显存被GPU视为私有,主机无法访问显存。这种显存GPU和驱动程序管理,被作为GPU运算过程中的中间存储。在这种模式下,GPU需要输入数据,或者输出结果时,就涉及大量从主机内存到显存的来回拷贝操作,增加延迟和能耗。如果显存从专有变为HDM,则可以被主机直接访问,不需要额外的数据移动操作。

3.CXL Type 3设备用于内存缓冲,包括带宽扩展、容量扩展(在扩展后,系统内存的带宽和容量即为本地内存和CXL内存模块的叠加),也包括存储级内存。Type 3设备支持CXL.io和CXL.mem协议,主要为主机发送的请求提供服务。由于这类设备不是加速器,所以它们不需要通过CXL.cache发出一致性请求。



总结一下:目前最接近成熟的应用估计是CXL内存, 4个512GB的CXL内存可以提供2TB的额外容量,叠加128GB/s的带宽,还是很超前的。希望intel 能在行业中有出色的表现。

★博文内容参考自 网站,与平台无关,如有违法或侵权,请与网站管理员联系。

★文明上网,请理性发言。内容一周内被举报5次,发文人进小黑屋喔~

参考来源

Intel: https://mp.weixin.qq.com/s/JRdMyw4wpKB4iJuHIscQZg

评论