炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:IT之家)
IT之家8月12日消息,科技媒体WccfTech昨日(8月11日)发布博文,报道称英特尔为其锐炫Pro系列GPU的Battlematrix项目,发布首个重磅软件更新LLMScalerv1.0,重点优化了AI推理能力。
IT之家曾于5月报道,英特尔在COMPUTEX2025台北国际电脑展上,推出锐炫ArcProB50和B60两张显卡之外,还推出了ProjectBattlematrix推理工作站平台,支持最多8张锐炫Pro显卡并具备软件包支持,能运行高达150B参数的中等规模且精度高的AI模型。
Battlematrix平台集成硬件与定制化软件栈,优化推理性能和企业部署体验;而LLMScaler是基于vLLM框架开发的AI大模型推理容器,支持多GPU扩展、长序列高效推理及多模态任务。

LLMScalerv1.0重点优化了vLLM推理框架,对于32BKPI模型,40K序列长度下性能提升可达1.8倍;70BKPI模型同条件下提升高达4.2倍,8B至32B规模模型输出吞吐量较上版提升约10%。
该版本还引入分层在线量化,有效降低显存占用,并支持管道并行、数据并行、多模态模型及嵌入、重排序等功能,提升模型适应性与扩展性。
为便于企业级运维,LLMScalerv1.0集成了XPUManager工具,支持GPU电源管理、固件升级、诊断及显存带宽检测。
新容器基于Linux平台,充分利用多GPU扩展和PCIe点对点数据传输,实现最高80%的整体性能提升,系统同时具备ECC、SRIOV、遥测与远程固件更新等可靠性与可管理性特性,满足企业级部署需求。


英特尔强调,新软件栈遵循行业标准,兼容主流开发流程,OneCCL基准测试工具的集成也为开发者调优和性能评测提供了便利,进一步丰富了Battlematrix平台的生态支持。
根据英特尔路线图,本季度内还将发布更为稳固的容器版本,进一步优化vLLM服务能力。预计到今年第四季度,Battlematrix项目将实现全功能版本落地,推动大模型推理平台的持续升级,为专业领域用户带来更高效、更易用的AI解决方案。

编辑:财经 来源:市场资讯