OpenAI再上新!推出“性价比之王”GPT-4o mini

活报告
07-22

美国时间7月18日,OpenAI即时上线新模型GPT-4o mini,并宣布它将取代GPT-3.5 turbo

OpenAI表示,ChatGPT的免费版、Plus版和Team用户在发布伊始即可访问GPT-4o mini,以代替 GPT-3.5 Turbo,而企业用户可以从下周开始访问。

另外,OpenAI还将在未来几天内开放GPT-4o mini微调版本。

图片

来源:OpenAI官网

“白菜价”、“小模型”,入门级AI的新突破

GPT-4o mini将是OpenAI此前推出的GPT-4o的“实惠版”,其API商用价格是每百万输入token 15美分,每百万输出token 60美分。

OpenAI表示,GPT-4o mini是目前功能最强大、性价比最高的小参数模型,性能逼近原版GPT-4,而成本比GPT-4o便宜96%~97%,比此前最便宜的GPT-3.5 turbo的成本还低60%以上。

外媒报道中称,目前,GPT-4o mini模型的应用程序编程接口支持文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。

对于新模型参数量的大小,OpenAI拒绝透露,但表示与谷歌的Gemini 1.5 Flash、Anthropic的Claude Haiku等类似的小模型处于同一级别。

新模型GPT-4o mini的创造性在于,它为开发人员提供一种轻量级且廉价的工具,这一工具比GPT-4更容易负担,让他们更便利地自动化基本的工作,同时也是OpenAI推动“多模态”(multimodality)技术发展计划的一部分。

而且,GPT-4o mini是首个使用OpenAI全新安全策略“指令层级”的AI模型,可以优先执行某些指令,例如公司的指令。相比以往,用户更难以让人工智能模型执行不正当的指令。

OpenAI的API产品负责人Olivier Godement解释了为何该公司未能更早推出“小而精”的AI模型,他说,这纯粹是“优先级”的问题,因为OpenAI专注于创建更大、更好的模型,如GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI注意到开发人员越来越渴望使用较小的模型,因此公司决定现在是投入资源开发GPT-4o mini的时机。

不仅如此,这一全新小模型也承载着帮助OpenAI走入更广泛的客户群体的希望。

OpenAI在今年早些时候的最新一轮融资过后,估值已经超过800亿美元

13.11>13.9?表现怎么样?

目前,新模型GPT-4o mini仍不具备全网检索能力,其知识范围局限于2023年10月以前。

对于近日令国内外大模型集体“犯难”的世纪问题:“13.11和13.9哪个大”,GPT-4o mini也预料之中地没能解决,它的发挥相当不稳定。

图片

 

不过,它的高阶版GPT-4o目前也对此类逻辑问题束手无策。可见OpenAI并未对新模型的回复逻辑做出很大的革新。

然而,优于GPT-4o的,OpenAI提到,此次发布的新模型GPT-4o mini“Faster for everyday tasks”

它的响应速度明显快于GPT-4o,几乎无需等待。从正式开放到当前全球用户的使用反馈来看,GPT-4o mini的“快”毋庸置疑,但实际使用体验上(包括指令执行完成度等)还差些火候。

根据OpenAI官方展示的数据,GPT-4o mini的性能表现出很强的竞争力,其在文本智能和推理基准、数学推理、多模态推理评估方面均优于其竞品Gemini Flash和Claude Haiku。

图片

来源:OpenAI官网

“小模型”或将流行,接下来还有谁?

在7月19日凌晨,紧随OpenAI,Mistral Al发布了12B的小模型,该产品是同英伟达合作开发,上下文长度为128K,与OpenAI正面对战。

按照计划,Meta也将于7月23日发布400B参数的Llama 3模型,并承诺将带来新的功能,如多模态能力、多语种对话、更长的上下文窗口以及更强的整体性能。

在国内,阿里云Qwen于7月16日推出了类似于GPT-4o的更适于小端应用的语音助手。而商汤早前已经推出首个实时交互模型“日日新5o”,科大讯飞的星火大模型交互性能也已对标GPT-4o。

可见,大模型公司的较量没有终点。同时,小端侧模型或将成为下一个大模型热门赛道。

OpenAI此次采用了抢先发布的营销策略,在推出小模型GPT-4o mini的同时,也进一步唤起了人们对GPT-5的期待。

据 OpenAI CEO Sam Altman透露,GPT-4o的语音模式将在本月晚些时候推出。

小端交互模型来了,AI生活化还会远吗?

(本文首发于活报告公众号,ID:livereport)

AI营收放缓,微软后市你还看好吗?
微软二季度营收、EPS盈利、营业利润至少同比增长10%,均较一季度增长放缓,但高于市场预期,AI回报失望,云收入意外放缓,盘后一度重挫8%,市值失血2500亿美元。【微软财报你怎么看?现在你会怎么操作?】
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法