英特尔® 至强® 6:专为 AI 和分析工作负载而构建

admin 数码科技 2024-11-25 882 0

搭载 P-core(性能核)的英特尔®至强® 6900 系列处理器现已推出。从计算密集型人工智能和高性能计算用例到关键任务关系数据库和分析应用程序,对数据中心性能的需求从未如此之强烈。英特尔®至强® 6 处理器旨在为 IT 团队提供面向各种工作负载的有针对性的增强功能,它主要借助于两种产品线:P-core(性能核)和 E-core(能效核)。

P-core(性能核)采用超线程内核,内置矩阵引擎可加速计算密集型人工智能、高性能计算和数据服务工作负载,而 E-core(能效核)则省去了矩阵引擎,以支持更高的单线程内核密度。

[MD:Title]

所有英特尔®至强®6处理器,无论是P-core(性能核)还是E-core(能效核),都采用相同的指令集、BIOS和内置I/O加速器,包括英特尔®数据保护与压缩加速技术(英特尔®QAT),英特尔®Data Streaming Accelerator(英特尔®DSA),英特尔®In-Memory Analytics Accelerator(英特尔®IAA)和英特尔®Dynamic Load Balancer(英特尔®DLB)。

它们还支持相同的驱动程序、操作系统和应用程序,以及数据中心所依赖的相同可靠性、可用性和可维护性 (RAS) 功能。

探索具有 P-core(性能核)优势的英特尔®至强® 6 处理器

企业希望在部署用于语言、视觉和图像识别以及推荐系统的最先进人工智能模型时节省资金和时间,并从高性能计算驱动的模拟和高级分析中获得更深入的见解。采用 P-core(性能核)的英特尔®至强® 6 处理器通过提供大量具有创新矩阵和向量引擎以及超高内存和 I/O 带宽的高性能内核,使企业能够抓住这些机遇。

[MD:Title]

为广泛的工作负载实现高性能

采用 P-core(性能核)的英特尔®至强® 6 处理器,每个插槽可灵活扩展至 128 个内核、12 个内存通道和 96 个 PCIe 通道,帮助企业满足不同的应用需求。对于希望缓解内存带宽瓶颈的 IT 团队来说,创新的多路合并阵列 (MRDIMM) 可提供高达每秒 8,800 兆 (MT/s) 的传输速度,同时通过快速完成工作来降低总体拥有成本。内置加速器为目标工作负载提供额外的提升,实现更高的性能和效率。

利用 CPU 的强大 AI 性能

采用 P-core(性能核)的英特尔®至强® 6 处理器旨在支持许多要求严苛的 AI 用例。P-core(性能核)通过英特尔® Advanced Matrix Extensions(英特尔® AMX)等加速功能,扩大了英特尔在内置 AI 领域四代产品的领先优势,目前支持 int8、BF16 和 FP16(新)数据类型。因此,P-core(性能核)可帮助满足从目标检测到中型 GenAI 等多种人工智能模型的服务级别协议 (SLA),同时提供开放标准、高性能、RAS 功能,并根据需要支持其他加速器。

优化通用工作负载的性能

采用 P-core(性能核)的英特尔®至强® 6 处理器在全范围工作负载上表现出色,其主流系列产品拥有 8-86 个内核,在基于双 CPU 的系统中,网络和存储外接卡拥有多达 176 个 PCIe 5.0 通道,而基于单 CPU 的系统中,单插槽产品则拥有 136 个 PCIe 通道。所有英特尔®至强® 6 处理器都能随着服务器利用率的增加而提供可扩展的每瓦性能,在整个负载线路上提供近乎线性的功耗-性能消耗,这凸显了所有英特尔®至强® 6 处理器的高效性。对于性能要求苛刻的工作负载,这意味着平台在高负载下有效地利用能耗,以帮助快速完成工作。

Performance-core(性能核)工作负载性能优势:

与第五代英特尔® 至强® 处理器相比:

● 借助英特尔® AMX,Llama2 性能提升高达 3 倍

● HammerDB MySQL 性能提升高达 2 倍

● 利用 MRDIMM,HPCG 基准测试的性能提升高达 2.5 倍

与第二代英特尔®至强® 处理器相比:

● 采用 INT8 的 ResNet – 50 BSX 的性能提升高达 17 倍

与竞争对手相比:

● 与 AMD EPYC 相比,借助 MRDIMM 的 AI 推理性能提升高达 5.5 倍

利用增强的安全功能跟上业务增长的步伐

在本地、边缘和云服务器上追求新的业务模式和数据共享,即使在处理敏感数据或受监管数据时也是如此。基于可信执行环境 (TEE) 的机密计算能够帮助在使用过程中保护数据和 AI 模型。采用 P-core(性能核)的英特尔®至强® 6 处理器允许客户选择最符合其业务和监管要求的机密计算技术。

应用程序隔离:英特尔® Software Guard Extensions(英特尔® SGX)提供旨在保护使用中数据的应用程序隔离。英特尔® SGX 是目前市场上研究和更新最多的数据中心机密计算技术。

虚拟机 (VM) 级隔离:英特尔® Trust Domain Extensions(英特尔® TDX) 在虚拟机级别提供隔离和机密性。在基于英特尔® TDX 的机密虚拟机中,客户机操作系统和虚拟机应用程序被隔离开来,无法被云端主机、虚拟机管理程序和平台的其他虚拟机访问。

增强针对 P-core(性能核)优化的目标工作负载

为 AI 、高性能计算和关系数据库等用例管理计算密集型工作负载的 IT 决策者,将从部署采用 P-core(性能核)的英特尔®至强® 6 处理器中获得最大收益。增加对 MRDIMM 内存的支持,还有助于缓解超大内存占用的内存数据库或大型语言模型 (LLM) 等用例的内存访问限制。

加速 AI 工作流程,以保持竞争力

采用 P-core(性能核)的英特尔®至强® 6 处理器由于配备了增强的内核、更大的内存带宽和强大的矩阵引擎,可提供充足的算力,以支持中小规模生成式人工智能模型的推理、微调和检索增强生成 (RAG) 用例。此外,针对英特尔®至强® 处理器的优化已集成到 TensorFlow 和 PyTorch 等在内的流行深度学习框架的主流发行版。

管理日益复杂的高性能计算和模拟

除内置矩阵引擎外,采用 P-core(性能核)的英特尔® 至强® 6 处理器还具有英特尔® Advanced Vector Extensions 512(英特尔® AVX-512),可加速科学模拟中常见的基于矢量的数学运算。由该平台提供支持的集群可帮助释放 3D 渲染、科学研究、金融模拟和计算机辅助工程的威力,以加快取得成果。

将基础架构和存储优化提升到新的水平

由于 P-core(性能核)和 E-core(能效核)共享相同的硬件平台,企业可以混合使用具有每种类型内核的系统来管理其基础设施中的各种工作负载,同时不超出功率预算,并遵守数据隐私和主权法规。计算密集型 P-core(性能核)可以支持 SAS 等高强度业务分析软件,而 E-core(能效核)可用于运行系统备份和软件更新等低强度、高空闲时间的工作负载。

提高工作效率,帮助消除边缘的延迟

通过将高性能计算资源置于更靠近终端用户和设备的位置,从而提高边缘生产力和延迟。采用 P-core(性能核)的英特尔® 至强® 6 处理器能够在边缘服务器中部署先进的人工智能模型,并提供所需的算力,以便从数千个物联网设备中快速获得洞察力。具有 136 个 PCIe 通道的单插槽选件还允许每个处理器使用更多的扩展卡,从而有助于在空间有限的部署中整合基础设施。

在保持快速、响应式分析的同时发展关系型数据库

P-core(性能核)处理器中的高级矢量引擎允许有效运行高级数据库和分析用例中常见的基于单指令、多数据 (SIMD) 的工作负载。英特尔® 至强® 6 处理器还能利用高水平的超低延迟缓存,帮助避免与资源争夺有关的延迟。利用该平台和英特尔® QAT 等加速器的多功能配置,可以在分析和存储复杂数据类型时快速得出结果。

[MD:Title]

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

评论

标签列表