奇谱科技 奇谱科技

CHIP奇谱
关注产品与技术 分享体验与新知
广告

英特尔发布4代可扩展至强处理器 重塑数据中心架构

作者:原创

虽然名义上是第4代,但是代号为Sapphire Rapid的至强可扩展处理器,为数据中心带来了翻天覆地的变化,成为一个时代的开端。

历经数个月推迟,2023年年初,英特尔所释放的“大招”,足以改变整个数据中心处理器生态,将甚嚣尘上的核心数量与I/O数量上的竞争,化为chiplet小芯片堆叠与多加速引擎的产品形态竞争。

英特尔一口气推出了第4代至强可扩展处理器(代号“Sapphire Rapids”)、至强CPU Max系列(代号“Sapphire Rapids HBM”)以及数据中心GPU Max系列(代号“Ponte Vecchio”)等多个系列产品,在实现数据中心性能、能效和安全性大幅跃升的同时,为AI、云、网络、边缘和全球领先的超级计算机带来全新功能。


根据英特尔公布的数据,与前一代相比,第四代英特尔至强可扩展处理器通过内置加速器将目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下每个CPU节能高达70瓦并对性能只产生极低的影响,同时将总体拥有成本降低52%到66%。


其中,至强CPU Max系列成为首款集成HBM2e片上内存的x86处理器,高带宽内存容量达64GB,可为内存带宽敏感性应用,如科学计算和AI工作负载,提供十余倍的性能提升。数据中心GPU Max系列在单个产品上整合47个小芯片,集成了超过1000亿个晶体管,为诸如物理、金融服务和生命科学等极具挑战性的工作负载带来更高的吞吐量。相较上一代产品,英特尔数据中心GPU Max系列和至强CPU Max系列的结合,可以使生命与材料科学领域LAMMPS处理性能提升12.8倍。


3D封装的chiplet小芯片制造方式,已经在新一代产品上得到广泛应用,实现制造技术的重大进展,Ponte Vecchio上的47颗小芯片,综合实现了计算、存储、网络多项功能。而这47个裸片来自于不同的代工企业,且采用5种以上的差异化工艺节点,集成了超过了1000亿个晶体管,将异构集成的技术提升至了全新水平。

通过EMIB封装技术,4个采用Intel 7支撑工艺的单元被集成在一个封装上,不仅使计算单元与内存控制器解耦,而且为未来扩展更多芯片功能作出了有益的尝试。如新一代产品已经全面升级为DDR5内存,进一步增加内存带宽,同时通过PCI-E 5.0和Compute Express Link (CXL) 1.1增加I/O接口带宽。模块化设计,灵活的接口与功能芯片组合,不仅缔造了Max系列CPU与GPU产品,同时为处理器内部集成更多功能引擎、为客户提供高度定制化的产品提供了可能。


目前,新产品针对客户的使用场景或应用提供接近50个有针对性的SKU,其中包括从主流通用SKU到面向云、数据库和分析、网络、存储和单插槽边缘使用场景的专用SKU。同时,4代至强处理器家族支持英特尔On Demand(按需服务),能够针对不同使用场景和外形规格提供不同的核心数、频率、加速器组合、功率和内存吞吐量,从而满足客户的实际应用需求。

内置多重引擎

单纯的CPU核数或运行频率增加,已经不能满足日益多样化的数据中心应用需求,4代至强处理器逐步将多种加速引擎,从软件或外置功能模块方式,转变为内置集成方式,提供更为多样的加速功能,这些处理器内含面向 AI、科学计算(HPC)、安全、网络、数据分析和存储的英特尔加速器引擎。相比增加 CPU 内核数,内置加速器对于提高工作负载的性能来说是能效更高。

Intel Advanced Matrix Extensions (Intel AMX),高级矩阵扩展

AMX可大幅提高深度学习训练和推理性能。它非常适合自然语言处理、推荐系统和图像识别等工作负载。

Intel QuickAssist Technology (Intel QAT),数据保护与压缩加速技术

作为内置加速器,其可通过卸载加密、解密和压缩释放处理器内核,从而让系统能够支持更多客户端运行或实现降低能耗的目的

Intel Data Streaming Accelerator (Intel DSA),数据流加速器

DSA 专为卸载常见的、会导致数据中心规模部署开销的数据移动任务所设计,能够帮助加速 CPU、内存和缓存,以及所有附加的内存、存储和网络设备之间的数据移动。

Intel Dynamic Load Balancer (Intel DLB),动态负载均衡器

DLB实现了在多个 CPU 内核/线程上高效地分配网络处理,并根据系统负载的变化而动态地在多个 CPU 内核上分配网络数据以进行处理。同时,英特尔 DLB 能够还原在多个 CPU 内核上同时处理网络数据包的顺序。

Intel In-Memory Analytics Accelerator (Intel IAA),内分析加速器

英特尔 IAA 帮助更快速地运行数据库和分析工作负载并提升能效。对于内存数据库和大数据分析工作负载,该内置加速器可在提高查询吞吐量的同时减少内存占用。

Intel Advanced Vector Extensions 512 (Intel AVX-512),高级矢量扩展 512

AVX-512具备两个融合乘加(FMA)单元和其他优化功能,可帮助提升要求严苛的计算工作负载性能,包括科学模拟、财务分析以及 3D 建模和数据分析等。

Intel Advanced Vector Extensions 512 (Intel AVX-512) for vRAN,面向 vRAN 的AVX512

面向虚拟无线接入网(vRAN)的英特尔 AVX-512 能够在相同的功率下为 vRAN 工作负载提供更大的容量,帮助通信服务提供商提高每瓦性能,以满足关键的性能、扩展和能效需求。

Intel Crypto Acceleration,密码操作硬件加速

英特尔密码操作硬件加速功能大大降低了实施普遍数据加密的影响,并提高了加密密集型工作负载的性能。

Intel Speed Select Technology (Intel SST),Speed Select 技术

通过允许客户配置单个服务器以匹配波动的工作负载,英特尔 SST 提高了服务器利用率并降低了鉴定成本。

Intel Data Direct I/O Technology (Intel DDIO),数据直接 I/O 技术

通过消除对主内存的频繁访问,能够帮助降低能耗、提高 I/O 带宽可扩展性,并降低时延。

Intel Software Guard Extensions (Intel SGX),软件防护扩展

通过加强基于硬件的内存保护,机密计算技术优化了针对敏感数据的隔离。

Intel Trust Domain Extension (Intel TDX)

在TDX机密虚拟机中,访客操作系统和虚拟机应用程序被隔离,以防止云主机、虚拟机管理程序,以及来自平台的其他虚拟机访问。

Intel Control-Flow Enforcement Technology (Intel CET),控制流强制技术

英特尔 CET 提供增强的硬件防护功能,抵御两种最常见的软件攻击,即面向返回和面向跳转/调用的编程攻击。


赞(0)
未经允许不得转载:奇谱科技 » 英特尔发布4代可扩展至强处理器 重塑数据中心架构
分享到:
广告