-
到底什么是AI Agent?重新审视AI Agent的定义与内涵
-
AI Agent现状如何?聊聊近期国内的智能体市场动向
-
AI Agent应用实践与应用发展趋势
-
如何快速打造适合自己的个性化AI Agent?(即将更新)
-
AI Agent产品与项目实操,如何用Coze、钉钉、Dify构建智能体?(即将更新)
-
Ollama+OpenUI+Dify,三位一体打造本地AI Agent系统(即将更新)
全文约2000字+PPT,阅读时间8分钟 文/王吉伟
在比尔盖茨预测“AI Agent将在5年内彻底改变我们生活”的1年后,现在AI Agent真的爆发了。
先来看看大模型厂商与软件厂商的动作。
10月22日,Anthropic发布了能操控电脑的Claude 3.5 Sonnet升级版。
10月24 日,微软开源了一款解析和识别屏幕上可交互图标的AI工具OmniParser。
OmniParser整体框架图
论文链接:https://arxiv.org/abs/2403.19128
代码:https://github.com/AlibabaResearch/AdvancedLiterateMachinery
10月25日,智谱AI正式推出了能够操控手机的AutoGLM(PC端推出网页版)。这两天还传出消息,OpenAI准备在明年1月推出一款代号为“Operator”的可以自动执行各种复杂操作AI助理产品。
其实在10月中旬,实在智能就在内部发布了手机智能体。除了推出UFO、OmniParser等能操控PC的技术架构和工具,微软还在9月推出了Windows Agent Arena 基准框架,用于评估生成式AI智能体在Windows PC上的性能。
Windows Agent Arena运行截图
论文地址:https://arxiv.org/abs/2409.08264
项目地址:https://microsoft.github.io/Win
硬件厂商在智能体方方面的动作,就更不用说了。
10月10日,vivo发布手机智能体PhoneGPT。
10月15日,联想发布了基于Meta的Llama模型的PC个人AI智能体“联想AI Now”,并在30日发布了其首款智能体一体机。
10月17日,OPPO发布首个手机厂商智能体开发平台。
10月22日,华为推出了全新的鸿蒙原生智能Harmony Intelligence以及搭载盘古大模型的小艺智能体。
10月23日,荣耀正式发布了搭载智能体的个人化全场景AI操作系统—MagicOS 9.0。
这次不再是媒体报道中的Agent,而是看到见摸得着的智能体。
今年双11,搭载智能体的AI电脑、AI手机成交额同比增长超100%,AI智能眼镜成交额同比增长了100%,是字节跳动旗下豆包于10月发布的首款AI Agent耳机Ola Friend也成了销量黑马。
继媒体大肆报道AI Agent之后,也终于轮到了券商高频出场。最近两个月,几十个券商都发布了AI Agent(智能体)相关的研报,搜索 AI Agent 关键词呈现的内容暴增,各大券商都在高调看好AI Agent的未来。
看一个行业火不火,还要看都有谁在炒作这个行业。在券商频频的各种研报攻势之下,二级市场有了很大的反应。在股民的热烈讨论之中,衍生出了「AI Agent概念股」「智能体概念股」「computer use”概念」「Phone use概念股」及「智谱概念股」等一系列概念股。
在很多股民看来,几年前像“元宇宙”那样一个虚无缥缈的概念都能炒得风生水起,现在已经落地应用并且大众都能感受到产品的AI Agent自然会更加坚挺,且值得大炒特炒。可以预见的是,元宇宙将会借助AI Agent提供的技术支持再次发光发热。
在企业端,主打Agent的上市企业市值开始上涨,比如联手智谱AI的教育公司豆神集团。关联某些AI Agent概念股的企业股价也会上升,比如华为AI Agent赋能的酷特智能等。
上市企业愿意贴上“AI Agent”标签,进一步证实了AI Agent的市场热度。可以想象,接下来又会有很多上市公司贴上Agent标签来提振股价了。
这一波利好AI Agent的热浪始于Claude3.5能够操控电脑,起于智能终端厂商的智能体,爆于智谱的AUtoGLM。
爆得重点不在于大模型能够操控屏幕,也不在于智能体如何操作手机,而是国内的智能体软件与硬件已经实现人人可用并且有了不错的销售业绩。
这个趋势下,早已推出能够操控电脑、手机的Agent技术架构和Agent产品的相关厂商,自然再度大受关注,而RPA Agent这一品类也凭借从操控PC到操作手机而迎来它的高光时刻。
以上内容,讲的是AI Agent的市场现状,源自王吉伟频道近期的观察总结。恰好最近接受ITpub和机械工业出版社的邀请要做一个分享直播,我便把这部分思考放入了用于直播分享的PPT中。
这个分享标题为《AI Agent应用实践与发展趋势》,内容主要分为四部分呈现:
-
什么是AI Agent(重新审视AI Agent定义)
-
AI Agent现状(近期的智能体市场动向)
-
AI Agent产品与项目实操
-
AI Agent应用发展趋势(12个应用方向与17个发展趋势)
在这个PPT中,也对很多粉丝关心的问题做了解答:
-
为什么Claude 3.5以“操控电脑”出圈引发国内智能体爆火?
-
如何快速打造适合自己的个性化AI Agent?
-
能否用Coze、钉钉等平台构建面向业务应用的智能体?
-
使用dify构建本地AlAgent
-
端侧Agent应用探索
在直播时,因为前面两部分内容讲得很细而用了太多时间,致使后面实操部分只是简单的演示了一下。当然这篇文章只放这个PPT,也无法进行实操演示。后面,我会抽时间把项目实操的部分做成几个视频,希望能够帮到大家。
这篇文章的文字内容就到这里,下面贴上这份直播分享的PPT。需要PPT原件以及文中提及两篇论文的朋友,回复 11.15 获取下载链接。
PPT内容:AI Agent应用实践与发展趋势
全文完
【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与AI Agent。】
精彩评论