英特尔升级多显卡 AI 推理，Battlematrix整体性能提升最高达80%

炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：IT之家）

IT之家8月12日消息，科技媒体WccfTech昨日（8月11日）发布博文，报道称英特尔为其锐炫Pro系列GPU的Battlematrix项目，发布首个重磅软件更新LLMScalerv1.0，重点优化了AI推理能力。

IT之家曾于5月报道，英特尔在COMPUTEX2025台北国际电脑展上，推出锐炫ArcProB50和B60两张显卡之外，还推出了ProjectBattlematrix推理工作站平台，支持最多8张锐炫Pro显卡并具备软件包支持，能运行高达150B参数的中等规模且精度高的AI模型。

Battlematrix平台集成硬件与定制化软件栈，优化推理性能和企业部署体验；而LLMScaler是基于vLLM框架开发的AI大模型推理容器，支持多GPU扩展、长序列高效推理及多模态任务。

LLMScalerv1.0重点优化了vLLM推理框架，对于32BKPI模型，40K序列长度下性能提升可达1.8倍；70BKPI模型同条件下提升高达4.2倍，8B至32B规模模型输出吞吐量较上版提升约10%。

该版本还引入分层在线量化，有效降低显存占用，并支持管道并行、数据并行、多模态模型及嵌入、重排序等功能，提升模型适应性与扩展性。

为便于企业级运维，LLMScalerv1.0集成了XPUManager工具，支持GPU电源管理、固件升级、诊断及显存带宽检测。

新容器基于Linux平台，充分利用多GPU扩展和PCIe点对点数据传输，实现最高80%的整体性能提升，系统同时具备ECC、SRIOV、遥测与远程固件更新等可靠性与可管理性特性，满足企业级部署需求。

英特尔强调，新软件栈遵循行业标准，兼容主流开发流程，OneCCL基准测试工具的集成也为开发者调优和性能评测提供了便利，进一步丰富了Battlematrix平台的生态支持。

根据英特尔路线图，本季度内还将发布更为稳固的容器版本，进一步优化vLLM服务能力。预计到今年第四季度，Battlematrix项目将实现全功能版本落地，推动大模型推理平台的持续升级，为专业领域用户带来更高效、更易用的AI解决方案。

海量资讯、精准解读，尽在新浪财经APP

编辑：财经来源：市场资讯