两种架构所拥有指令集也略有区别。P核Granite Rapids依旧是采用此前的至强架构,对每核性能进行了优化并提高了能效,新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展(AMX)、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA L2高速缓存分配技术/代码和数据优先级(CAT/CDP);同时Granite Rapid的微架构对性能也进行优化,包括:64KB、16路指令高速缓存(I-cache),改进分支预测和错误恢复,3-cycle浮点乘法,更好的内存请求和预取能力。与当前的第四代至强相比,其容量是前者的2倍,浮点乘法也从4/5个周期减少到3个周期。
E核Sierra Forest则采用英特尔全新的至强架构,拥有优化的能效吞吐量性能,软件功能支持BF16、FP16转换,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。该处理器将拥有144个核心,可提供双插槽配置。在微架构上,Sierra Forest也进行了优化和改进,包括64kB 指令缓存、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2。
英特尔表示,与当前第四代至强处理器Sapphire Rapids相比,基于E核打造的至强处理器Sierra Forest在云计算领域可将机架密度提高250%,将每瓦性能提高240%。全P核的Granite Rapids处理器经过优化,可为高性能核心需求和通用计算工作负载提供支持。Granite Rapids将进一步增强处理器的AI性能,内置加速器可提高特定工作负载的性能和效率。英特尔称,Granite Rapids可以为混合人工智能工作提供2到3倍的更高性能表现。
E核至强处理器Sierra Forest预计将在2024年上半年正式推出,而P核至强处理器Granite Rapids将紧随其后登场。
,