大模型落地考,难点在哪里?| 2024 WAIC

大模型落地考,难点在哪里?| 2024 WAIC

图片

文|周效敬

编|王一粟

去年是百模大战,今年走到了应用的深水区。

“应用,还是应用”,去年都是技术大咖在前台分享,今年更多是应用的负责人。论坛太多,嘉宾都不够用了。

这是光锥智能在2024 世界人工智能大会(WAIC)现场最直观的感受。500+家企业参展,1500+项展品展出,200+位重磅嘉宾演讲,这个占地5万多平米的会场上人头攒动,到处弥漫着对技术落地和应用的关切。

去年的WAIC,行业更关注大模型技术的追赶和突破,那么今年WAIC则更加聚焦于商业化落地,探索可行的商业模式和盈利途径。

世界人工智能大会是中国大模型玩家集中“秀肌肉”的一个绝佳舞台,大会现场展示了上百款大模型产品,不仅有百度文心一言、讯飞星火、阿里通义千问、腾讯元宝、华为盘古等这些来自头部厂商的热门产品,也有Minimax、百川智能、智谱AI等新晋玩家的产品展出。

“人是被忽视的因素,不是企业里所有人都拥抱AI。小企业把AI当成革命的工具,大企业把AI当成工具的革命。当大企业也意识到AI是革命的工具,变化就会到来。”中国工程院院士、之江实验室主任、阿里云创始人王坚在大会上说。

图片

中国工程院院士、之江实验室主任、阿里云创始人 王坚

王坚道出的是中国大模型商业化落地的基本现状。

据《中国新一代人工智能科技产业发展报告2024》,2023年中国人工智能核心产业规模达5784亿元,增长13.9%;中国生成式人工智能的企业采用率15%,市场规模约为14.4万亿元。

与去年相比,今年大模型的应用更加深入,但这依然不够。

拼应用,大模型厂商

使出浑身解数

在大模型刚刚兴起时,由于技术和经验的限制,大模型在落地过程中需要投入更多的资源进行研发和调试,导致当时的落地比较重,不少人也停留在AI 1.0时代的旧思路中。一年过去,大模型厂商的落地策略发生了不小的变化。

首先,在商业模式上更加成熟,新的商业模式也在探索。2023年,大模型商业化处于早期探索阶段,主要通过API接口调用付费,面向C端用户则以订阅制,尝试通过PaaS平台以及MaaS模式进行商业化尝试。

2024年,随着产品和工具的完善,再加上大模型的降价潮,让可商用迈入了一个全新的阶段。

另一个变化是,从通用大模型占主流,到垂直领域大模型兴起。

一个大模型没法解决全世界的问题,更细分、更专业的大模型和应用不断涌现。在医疗领域,润达医疗与华为云合作研发了“良医小慧”,蚂蚁集团推出百灵大模型,支撑起金融AI助理“支小宝”和AI就医助理的落地;在教育领域,网易有道推出了“子曰”教育大模型,猿辅导也推出了看云大模型;“携程问道”则是旅游大模型,这些都是垂直趋势下的产物。

大模型正在从“通用”向着“有用”发展,垂直化、专业化则是表现出的一个必然趋势。

此外,将大模型与Agent技术结合,也是实现大模型业务价值落地的一个途径。在中国,已有多家厂商发布了自己的Agent智能体平台,这些平台利用大模型技术,提供从任务自动化到软件开发等一系列智能服务。

图片

比如,腾讯推出了AppAgent项目,一个通过自主学习和模仿人类行为在手机上执行任务的多模态代理;字节跳动上线了一站式 AI 开发平台“Coze 扣子”,可支持 30 秒无代码生成 AI Bot,集成了超过 60 种不同的插件,覆盖新闻阅读、旅行规划、生产力工具等多个领域;百度也升级了产业级AI原生应用开发平台“千帆AppBuilder”,大幅降低AI原生应用开发门槛,提升开发效率。

光锥智能了解到,基于讯飞星火大模型构建的“星火企业智能体平台”,已陆续应用到金融、能源、工业、运营商等领域,已与金山等20余家生态厂商建立互认证生态。推广市场3个月,累计使用次数已超过500万次,覆盖57个企业岗位,单次企业办事效率提升10倍以上。

为了尽快落地,大模型玩家对to B和to C两个方向的选择截然不同且充满争议。

按企业服务领域的惯性来说,大模型to B应用可以带来更大的行业价值,可以更快实现,但传统企业普遍不敢用、高管不想用、企业不愿为软件付费。因此,创新工场创始人、零一万物CEO李开复认为,短期来看大模型在中国to C的应用更有机会,但挑战在于推理成本高,在考虑产品市场匹配度时,还要考虑技术需求、技术难度和成本等因素,而且还需要把握时间窗口。

大模型在B端落地更难,但也不全是如此。过去一年里,在多数厂商仍处于POC阶段时,盘古大模型已在30多个行业、400多个场景中落地,覆盖了从高铁巡检、气象预报到钢厂场景仿真、具身智能,再到工业互联网等场景。

华为在B端落地的经验能否复制?坦白说有点难。华为拥有强大的to B和to G能力是不争的事实,经验积累多、资源多,深耕行业多年,亦建有20大产业军团。另一方面,盘古的快速落地也离不开多年来ISV(独立软件提供商)的生态建设,比如中软动力、软通动力、南威软件等,都是深耕各行业的软件服务商,其他大模型厂商很少具备这些优势。

大模型玩家并没有摆脱互联网领域的发展路径,为了快速落地,这一年来大模型厂商也掀起了激烈的价格战。接近地板的价格虽然降低了开发者和企业的使用门槛,加快了大模型技术的推广,但弊端也不可忽视,可能引发恶性竞争,造成市场混乱,影响消费者对大模型价值的判断,长期可能对市场信心造成负面影响。

图片

百度董事长兼CEO 李彦宏

百度董事长兼CEO李彦宏在大会上说,过去这一年多来,行业处在非常热闹的“卷模型”之中,一度出现了百模大战的盛况,造成了极大的算力浪费。

但卷模型的成果也是显而易见的,国产大模型的能力跻身世界领先水平。

智谱AI首席执行官张鹏坦言:“(打价格战)这个阶段用户是获益的,但是这种事情肯定无法长久,它不是一个正常的商业逻辑。”

除了拼价格,大模型玩家在技术上依然在疯狂内卷,因为技术是未来大规模商业化落地的基础。阶跃星辰在会上发布了三款Step系列通用大模型新品:Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。

多模态是当前的热门技术方向,此前华为云发布的盘古5.0也是多模态,规模也达到了万亿级。

当下,在落地这件更加紧迫的事项面前,并非所有的模型都在强调参数。百度最近发布的文心大模型4.0 Turbo并未明确具体的参数,百度也提到通过技术升级,降低了大模型推理的成本,这意味着百度可能在保持或提高模型性能的同时,优化了模型的效率和资源消耗。

在WAIC展区,光锥智能看到了大模型在各领域的最新成果,拼应用可谓使出了浑身解数。

阿里通义APP以“通义十二时辰——体验AI助手陪伴的一天”为主题,围绕对话、效率、智能体、视觉四大核心板块进行功能集中展示和互动体验。参观者可以体验“定制个性化声音”,观看“动态版韩熙载夜宴图”,创作“涂鸦作画个性扇子”等特色打卡互动活动。

蚂蚁集团展示的支付宝智能助理是国内首款办事型的智能助理,用户不用找入口,问一问就为你办事、问诊、打车等,不仅“有脑有嘴能对话”,还“有手有脚能办事”,AI越来越像“扫码支付”一样,让每个人的生活更加便利。

智能终端方面,大会展出了小鹏的AI天玑系统,该系统基于小鹏自研大模型和通义大模型能力,将AI全面应用于座舱和智驾,千人千面,提升车辆的智能化体验。

在大会上,网易伏羲发布首个机器人品牌“灵动”,产品已落地50个重点工程项目。网易灵动是网易伏羲基于自研工业大模型和AOP技术思想打造的机器人品牌,旗下的挖掘机器人和装载机器人两款核心产品,已参与10多个省份的50个重点建设项目,覆盖矿山、港口、搅拌站、学校等多种应用场景。

本届大会展出智能机器人45款,其中人形机器人25款。观察大模型落地,人形机器人这块绕不开,人形机器人集成了人工智能、高端制造等先进技术,它将深刻变革人类的生产生活方式。

图片

人形机器人

现场发布了全球首个全尺寸开源公版人形机器人青龙、国内首个全尺寸人形机器人开源社区、特斯拉Optimus二代产品,同时宇树科技展示了国内首款实现奔跑功能的全尺寸通用人形机器人H1等。

其中,青龙身高185厘米,体重82公斤,全身多达43个主动自由度,最大关节峰值扭矩400牛米,算力支持400TOPs,支持快速行走、敏捷避障、稳健上下坡和抗冲击干扰等四大运动功能,是通用人工智能软硬件开发的理想载体。

特斯拉带来的Optimus 二代人形机器人比第一代更灵活,可操作的任务更复杂,借助大模型技术,身体控制能力增强,手指部分搭载触觉传感器,甚至能完成抓鸡蛋等精细动作。特斯拉在Optimus的落地上颇有雄心:目标年产10亿台,计划切走市场10%以上份额。据了解,Optimus预计在2025年开始限量生产,会有1000+台在特斯拉工厂协助人类完成生产任务。

各大模型厂商为了商业化落地做出各种商业模式、使用场景的探索,进行技术的突破,落地和应用比去年更有深度。人群在眼花缭乱的产品中攒动,兴奋之余,大家最关心的问题还是——大模型如何大规模商业化落地。

看落地,当下的

难点是什么?

据公开数据,截至2024年4月底,国内共推出305个大模型,10亿参数规模以上的大模型数量已超100个,大模型厂商的数量客观,但在落地上还存在不少问题。

“人的因素容易被忽略,当我们讲AI对每个部门都会产生影响,AI是革命性力量的时候,要所有部门的所有人都去拥抱AI,这在很多大企业是很难的。小企业跟大企业的差别就是,大企业会觉得AI是工具的革命,而小企业一定会觉得这是革命的工具。”

王坚在大会上说,当大企业也意识到AI是革命的工具,变化才会到来。

王坚观察到的现象是中国企业对AI的态度之现状,让所有企业都去拥抱AI、拥抱大模型并不容易。中国移动从2023年年初开始启动大模型研发工作,当年就推出了139亿参数的大语言模型,在公司内部和客户中加快推进大模型落地,但面临的一大挑战是,行业如何看待和拥抱大模型,行业内部对于大模型的看法和接受程度不一,存在思维方式的转变问题。

“我们见行业客户,他们都会问:大模型到底能干什么?能带来什么价值?要先从哪些领域开始用?这些对客户而言都是很现实的问题。”中国移动研究院AI中心副总经理金镝介绍说,在成本上也存在很多现实问题,比如用大模型需要买多少算力,投多少人做数据治理和训练模型,需要多少人做运维等等。

“我们今天并没有找到AI产生如此效果的本质,没有人能用数学的方法描述它。这就好比钻木取火,火有用处,但钻木并非最好的方法。今天的AI依然处在钻木取火阶段,因此成本高昂。”蚂蚁集团CTO何征宇近日表示,在大模型的“钻木取火”阶段,规模落地需要攻坚三大挑战:可靠性、经济性、易用性。

在具体的场景里面,我们可以看到更细节性的问题。

蚂蚁集团大模型应用负责人顾进杰在谈及“严谨产业需要怎样的AI”时说,领域知识相对缺乏,复杂决策难以胜任,对话交付并非端到端的体验,这些是行业存在的问题。他们的应对策略是,针对知识缺乏,构建大规模知识引擎;针对复杂决策,让智能体借鉴人类的思考方式等等。

在大模型落地工业场景方面,施耐德电气数字化总设计师毛春景提到一个“两难问题”:由于制造业企业的数据、知识、经验等无法分享,导致数据流动差,难以出现垂直行业大模型;然而,如果单个企业出面做私有化垂直的微调大模型,又会面临训练成本高、维护难度大的问题。

此外,大模型需要进行二次预训练,对算力的需求非常迫切,目前存在较大的算力缺口,特别是在国产算力方面。算力不足限制了模型的训练速度和规模,也可能影响模型的最终性能。

总的来看,大模型落地难的直接原因在于客户侧的拥抱程度,接受不接受,经济不经济,可靠不可靠等等。而根本的原因还得往大模型本身上找,技术够不够好,成本够不够低等等。当然,大模型的成本高低也与客户的规模大小密切相关,模型厂商与客户是一个互相促进、螺旋式上升的关系。

下一轮能力的

最大突破在多模态

有段子说,AI能够解放人类的生产力,能够让人类关心诗和远方,但是我们现在更多看到是AI在诗和远方,我们人类还是在做我们原来的这些事情。这个段子一定程度上反映了AI当下存在的问题。

以大模型作为代表的新一轮的人工智能技术浪潮汹涌澎湃,它的能力究竟如何?在千行百业落地的过程中有哪些新的可能性?新价值链的形态是什么,影响又会如何?一些大模型创业者给出了自己的思考。

图片

产业发展主论坛圆桌对话

MiniMax创始人、首席执行官闫俊杰认为,GPT 4存在30%~40%的错误率,国内大模型整体上存在60%~70%的错误率,要想让AI从一个辅助人类的工具到能够独立完成工作,为社会创造更大的价值,最核心的一点是整体降低大模型的错误率。

“当模型的错误率变成个位数的时候,即在人类定义的测试上都可以接近人类最好水平的时候,它在实体经济里面产生更大的效益就变得更加自然了。”闫俊杰说。

在AI的感知智能时代,AI已经在特定场景的语音识别、图像识别等指标上超过人类的水平,但离能思考和决策的阶段还差很远,更不用提AGI(通用人工智能)。

“大模型带来了新的机遇,它能够在一个模型上提供泛化能力,解决一系列场景和应用的多样需求,从而解决成本和收益的平衡问题,这是它的本质特点。” 智谱AI首席执行官张鹏说。

对于如何用新一代生成式AI的技术和大模型的技术赋能实体经济,张鹏认为,一定要构建更通用的、更基础的能力,利用这个通用和基础的能力去解决多新的问题,然后用收益的总和去除以投入成本,一定要从这个方向去解题。

未来大模型要更好地帮助人,更好地落地,下一轮能力的最大突破点会是什么?张鹏的答案是多模态。

人在现实世界中解决问题时,需要输入的信息本身就是多模态,除了自然语言以外,还有视觉、听觉、触觉、常识等,所有这些要素综合起来才能解决现实世界中的问题。

所以,大模型的能力在多模态方面的突破,会带来AI的普惠,为AI开启更多的可能性。原来的投入产出是一个金字塔型结构,即投入很大,但是收益很小;只有将它变成一个倒金字塔结构,这样才能真正放大它的价值。

新技术在催生新的产业变迁的同时,也会构建一个新的价值链,AI产业也是如此,从单点爆发到各行业的全方位突破,AI所创造的价值也将是指数级的。

王坚是一个乐观主义者,他认为GPT的潜力还没有被完整地探索,所有的问题要在动态的过程中解决——不能以现在这个时刻的状态来解决十年以后的问题,要拿十年以后的状态来解决十年以后的问题。

因此,我们有理由相信,中国大模型在商业化落地中遇到的问题,也必然会在大模型的动态发展中得到解决。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论