作者|谢涵
编辑|陈秋
运营|陈小妍
另镜(ID:DMS-012)
目前,AI大模型虽然还处于早期发展阶段,但国内外科技企业都已有深深的危机感。AI大模型不仅在颠覆互联网的流量入口,更重要的是开启新一轮生产力变革,也将是重塑下一个时代超级APP的核心技术。
在发布首个视频生成模型Sora震惊外界后,OpenAI时隔三月又放出大动作,近期发布了最新的GPT-4o。可横跨语音、文本和视觉,并且可以感知人类情绪,可随时被用户的指令打断,根据指令提供更丰富语音语调或不同风格。
与以往不同的是,OpenAI此次并未把新的旗舰大模型聚焦在参数上,而是更多在产品的体验上和场景的应用中,从目前行业发展来看,如果说过去一年,AI大模型是爆火出圈的一年,那么2024年,将是AI大模型落地实际场景应用和推动产业变革的一年。
与此同时,国内外头部科技企业公司面对GPT-4o的诞生,再次加速开启新一轮竞赛。谷歌发布了Project Astra和Veo,直接对标目前OpenAI领先的GPT-4o与Sora。
微软发布以AI为核心能力的Copilot+PC,选用最新的高通X Elite芯片,并改变交互模型,最重要的是搭载的AI模块真正实现本地化大模型,直接影响了通用大模型的商业价值,成本也直接成为商业化的衡量因素。
值得注意的是,近日国内科技公司字节跳动、阿里、百度、腾讯、科大讯飞都先后加入了价格战,以寻求更多的商业化机会,但另镜认为,不同于互联网红利时期,AI大模型技术创新和差异化场景落地能力才是激活AI大模型市场活力的关键因素。
在AI大模型技术的快速迭代下,国内哪一家企业有机会抢得先机?
5月29日,在发布“日日新SenseNova 5.0”大模型仅5周后,商汤在香港举办发布会,正式发布“商量”粤语版本,API输入及输出价格均为30港元/百万Token(词符)。商汤还宣布,自2024年7月1日起,“商量”粤语网页版及应用程序(APP)将永久免费向粤语区用户开放使用。
自去年4月首次发布“日日新SenseNova”大模型以来,商汤已推出5个版本,其综合能力全面对标GPT-4 Turbo。
商汤“日日新SenseNova 5.0”为何会快速做到技术领先,核心的技术壁垒是什么?目前行业还处于早期发展阶段,商汤大模型真正的优势有哪些,又面临哪些挑战?
大模型快速迭代,会为行业带来什么?
Distinct Mirror
商汤和OpenAI成长路线十分相似,公司发展都是靠技术沉淀。2020年对于商汤来说是非常关键的一年,技术路线或战略定位稍有误判,都有可能在下一个路口掉队。这一年的夏天,商汤启动在上海临港区建设人工智能计算中心(AIDC)。
2022年1月24日,商汤AIDC正式运营,成为亚洲最大的人工智能计算中心。目前,商汤大装置总算力规模在超过4.5万块GPU的加持下,达到12000 petaFlOPS。
2023年,生成式AI业务成为商汤的核心板块业务,这也是商汤一次重要的战略抉择。商汤生成式AI业务营收也迎来了高增长。3月26日,商汤发布2023年财报,生成式AI业务营收12 亿元,同比大增199.9%,占营收比重 35%。
就在上个月,商汤发布日日新SenseNova5.0,采用混合专家架构(MoE),参数量高达6000亿,支持200K的上下文窗口。性能全面对标GPT-4 Turbo。次日,商汤港股仅一上午暴涨31.15%,股价更是连续7个交易日上涨。
长期被低估的商汤,为何被市场看好?对此,有分析认为商汤核心竞争力是其大模型能力的飞跃、提供全套AI落地。但另镜认为,本质是日日新SenseNova大模型发布节奏超预期,商汤AI大模型技术能力,不仅赋能行业以及终端应用突破,更重要的是在企业层面,对于AI大模型的训练和场景落地产生了实实在在的效果,获得了客户的认可。
商汤大模型坚持的技术路线是,在尺度定律的指导下,持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界,重心放在解决数据质量的瓶颈。
此次日日新5.0大模型能力显著提升,其背后是训练数据的全面升级与训练方法的有效提升,以及商汤AI大装置SenseCore算力设施与算法设计的联合调优。算力设施架构和模型算法协同定义,这也是商汤大装置联合迭代的核心能力。
5月21日,国内权威大模型测评机构SuperCLUE最新榜单出炉,从4月的评测结果来看,商汤日日新5.0(SenseChat V5)的中文基准测评结果排名第一。以总分80.03分的成绩刷新国内最好成绩,并且在中文综合成绩上超越GPT-4-Turbo-0125,这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。
从SuperCLUE此次榜单测评结果来看,日日新5.0大模型在文科类中文任务上好于国外大模型,各项能力表现较为均衡;在长文本、生成创作、角色扮演、安全能力、工具使用上处于全球领先位置,适用于智能体、内容创作、长程对话等应用场景。
AI大模型加速行业新对决
Distinct Mirror
5月22日凌晨,微软举办Build 2024大会,一口气发布60种新产品和解决方案,且一切都与AI有关,重头戏就是Copilot和模型生态。GPT-4o现可在Azure AI Studio中使用,也可作为API使用。
这一切被外界解读为微软等来了与苹果再次反击的机会。微软开发的AI小语言模型(SLMs)Phi-3系列也发布了一款新的——Phi-3-vision,并已可在Azure中使用。
而当我们打开手机,平时手机里最常用的聊天软件、办公软件、出行软件、拍照功能等各类应用,也都在发生很大变化。各大应用软件都在打造行业专属Copilot,满足用户多样需要,而大模型对于各大应用最大的改变就是催生了很多新的功能。
端侧大模型已经成为大模型重要落地场景,简单的Copilot功能可以帮忙查阅邮箱,记录通话信息,并协助提炼通话内容,管理会议议程。
大模型发展已经进入2.0阶段,无论是系统软件,还是手机、PC以及汽车终端,在AI大模型的不断加持下,各行各业的头部企业重新展开真正意义上的对决。
在过去一年多,小米与商汤有着非常深度的AI大模型落地场景的合作,小米汽车在端侧大模型需求非常强,需要在无网、弱网场景下给用户同时提供比较好的体验,而这正好是商汤技术深耕的强项。
不仅如此,在AI大模型加持下,小米的语音助手对话和服务能力大幅度提升,产品非常难增加的活跃用户次日留存增加10%,检索不常见问题满足率也由20%多提升到80%多。
OpenAI最新的GPT-4o,最让外界震撼的就是根据指令提供更丰富语音语调或不同风格。
而在国内,阅文正在与商汤拟人大模型合作,创建了名为“筑梦岛”的AI原生虚拟社交生态平台,当前整个窗口长度32K,已能记住上百人对话,随着用户和角色的聊天越来越深入,整体聊天体验也会持续优化。
据悉,商汤日日新·商量-拟人大模型高级版本(SenseChat-Character-Pro),在面向中文角色扮演对话代理(RPCAs)领域的CharacterEval测评中超越GPT-4位列第一、达到SOTA,核心维度全面领先。
目前商汤大模型技术场景落地,不仅赋能科技和影视等企业产品创新,还在传统的煤矿行业、监管高的金融行业,以及医疗、电网巡检、城市管理等多领域展开了深度合作。
大模型发展还在摸索期,有诸多不确定性
Distinct Mirror
在日日新SenseNova5.0发布会上,商汤现场演示了《街头霸王》游戏PK,绿人是由大模型GPT-4操纵。红人是由商汤轻量版端侧大模型——SenseChat Lite操纵。
结果显示,在端侧,小模型更具优势,可以快速出击,打得大模型无力还击。端侧轻量级模型场景落地,也在一定程度上影响了通用大模型的商业前景,成本也成为商业化的衡量因素。
硅谷VC张璐表示,开源模型的快速发展,为初创企业和大企业提供了另一种选择,也能更高效地优化能耗和基础设施成本。初创企业可以调动最前沿大模型的API,在上面配套使用开源模型,再自己做些修改进行模型调优。
AI大模型的全面竞争,正在从单一的文生文,拓展到文生图、图生图、文生视频、图生视频等多模态能力。
我们看一组商汤「秒画文生图」大模型5.0版本图片,另镜测试的提示词是一个女孩从面无表情、到真实人像、再到绽放笑容和再笑一点。
测试过程,会发现「秒画」的优点是对于提示词理解和生成的图片非常快,最重要的是能快速读懂提示词的连贯性,文生图的效果已经具备很好的实用性。
根据不同的提示词,「秒画」可以不断微调,用户在图片创作、海报设计、游戏出图等多场景中都可以利用文生图增加创作灵感、节省时间和人力成本。
值得注意的是,GPT-4o增强了3D视觉内容生产能力,2023年3月,商汤也在AppleStore上线了格物3D新应用,3D视觉内容生产能力,有更好的训练推理能力,也能更好地理解空间事物,会是AI生态构建及应用落地进程中重要的AI大模型创新技术。
近日,商汤科技董事长兼CEO徐立在受邀论坛发表主旨演讲中指出,在中国做AI大模型开发有一个很重要的优势,就是可以与非常多的产业化数据相结合。AI大模型能力提升,依赖于针对行业场景进行差异化的高质量数据要素的构造。
AI教父杰夫里·辛顿教授在近日的视频采访中表示,AI大模型的发展真正的关键是数据规模和计算的规模,大语言模型正在寻找共同的结构,然后编码任务,那么效率也会得到更大的提升。他认为,GPT-4参数越大,会更有创造力,它会比人类更有创造力。
目前国内的大模型行业仍处于初步阶段,由于前期算力基础设施需要大量资金投入,未来通用大模型领域可能会向头部厂商集中,更多厂商需要向垂类大模型转型,垂类大模型以及端侧大模型将是未来主战场。
而当AI大模型真正落地企业场景,就会发现技术积累非常重要,很多棘手问题并没有太多时间去解决,当前AI大模型并不是一味追求大参数,而是要能为企业提供高质量数据、与实际落地场景相匹配和拥有解决问题的能力。
精彩评论