我开仓了
$美国超微公司(AMD)$ ,1. 技术合作:模型与硬件的深度集成 AMD将DeepSeek的DeepSeek-V3模型集成至其旗舰GPU产品Instinct MI300X,并通过SGLang框架和ROCm软件生态进行优化,显著提升了AI推理性能。具体技术亮点包括: - FP8低精度计算支持:AMD扩展了ROCm生态对FP8(8位浮点数)的支持,解决了内存瓶颈和高延迟问题,使相同硬件条件下可处理更大规模的模型或批处理任务,推理效率提升。 - 能效比优化:MI300X GPU专为高性能计算设计,结合DeepSeek-V3的混合专家架构(MoE)和多头潜在注意力(MLA)技术,计算密度与能效比显著提升,适用于数据中心和实时推理场景。
精彩评论