6月25日,阿里巴巴达摩院发布“低碳版”巨模型M6,在全球范围内首次大幅降低万亿参数超大模型训练能耗。通过一系列突破性的技术创新,达摩院团队仅使用480卡GPU,即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升近11倍。大模型将成下一代人工智能基础设施,在AI界已成共识。与生物体神经元越多往往越聪明类似,参数规模越大...
网页链接6月25日,阿里巴巴达摩院发布“低碳版”巨模型M6,在全球范围内首次大幅降低万亿参数超大模型训练能耗。通过一系列突破性的技术创新,达摩院团队仅使用480卡GPU,即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升近11倍。大模型将成下一代人工智能基础设施,在AI界已成共识。与生物体神经元越多往往越聪明类似,参数规模越大...
网页链接
精彩评论