Meta 推出最大的 Llama 3 人工智能模型,标榜语言和数学方面的进步

Reuters07-23 23:00

((自动化翻译由路透提供,请见免责声明 )) Katie Paul

路透纽约7月23日 - Meta Platforms 周二发布了其主要免费的Llama 3人工智能模型的最大版本,其多语言技能和一般性能指标均超过了OpenAI等竞争对手的付费模型。

Facebook 母公司在博客文章和一份研究论文中宣布,新的 Llama 3 模型可以用八种语言对话,编写更高质量的计算机代码,并能解决比以前版本更复杂的数学问题。

该模型拥有 4050 亿个参数(即算法在生成对用户查询的回复时所考虑的变量),与去年发布的前一版本相比相形见绌 (link),但仍小于竞争对手提供的领先模型。

相比之下,OpenAI的GPT-4模型据说有1万亿个参数,亚马逊正在投资一个拥有2万亿个参数的模型 (link)。

在这一消息发布之际,科技公司正在竞相证明,它们不断增长的资源消耗型大型语言模型组合能够在已知的问题领域(如高级推理 (link))带来足够显著的收益,从而证明对这些模型所投入的巨额资金是值得的。

除了其旗舰产品 4050 亿参数模型外,Meta 还发布了最初于 (link) 春季推出的重量更轻的 80 亿参数和 700 亿参数 Llama 3 模型的更新版本。

所有三个新模型都是多语种的,可以通过一个扩展的 "上下文窗口 "处理更大的用户请求,Meta的生成式人工智能主管艾哈迈德-达赫勒(Ahmad Al-Dahle)说,这将特别改善生成计算机代码的体验。

这是我们从社区得到的首要反馈,"Al-Dahle在接受路透采访时说,"更大的上下文窗口为模型提供了类似于更长的内存,有助于处理多步骤请求。

Meta 发布的 Llama 模型基本上是免费供开发者使用的,公司首席执行官马克-扎克伯格(Mark Zuckerberg)表示,这一策略将以创新产品和提高公司核心社交网络参与度的形式获得回报。然而,一些投资者对这一战略的成本 (link)。

如果开发者选择使用该公司的免费模式而不是付费模式,该公司也将从中获益,这将削弱竞争对手的商业模式。Meta在发布公告时吹嘘了其在关键数学和知识测试中取得的成果,这可能会使这一前景更具吸引力。

虽然人工智能发展的进展很难衡量,但 Meta 提供的测试结果似乎表明,其最大的 Llama 3 模型几乎与 Anthropic 的 Claude 3.5 Sonnet 和 OpenAI 的 GPT-4o 不相上下,而后者被广泛认为是市场上最强大的两个前沿模型。

例如,在竞赛级数学单词问题的 MATH 基准测试中,Meta 的模型获得了 73.8 分,而 GPT-4o 为 76.6 分,Claude 3.5 Sonnet 为 71.1 分。

该模型在 MMLU(涵盖数学、科学和人文科学等数十个学科的基准测试)上的得分为 88.6,而 GPT-4o 为 88.7,Claude 3.5 Sonnet 为 88.3。

在论文中,Meta 的研究人员还预告了即将于今年晚些时候推出的 "多模态 "模型版本,该版本将在核心 Llama 3 文本模型的基础上增加图像、视频和语音功能。

他们说,早期实验表明,这些模型的性能可以与其他多模态模型相媲美,如谷歌的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法