依托搜索,百度正在打造中国最大的智能体生态

互联网怪盗团
05-30

最近半个月,关于生成式AI,最流行的话题是“国产大模型降价”:主流大模型的API调用价格普遍降低了90%以上,轻量级版本的大模型免费也已屡见不鲜。在许多人心目中,生成式AI就意味着大模型,大模型就意味着价格战,价格战就意味着“往死里卷”——这是中国科技行业最擅长的。除此之外,还有什么值得关注的新东西吗?

当然有。大模型只是生成式AI的技术基座,关键在于应用层。我们早已熟悉了以ChatGPT为代表的聊天机器人(Chatbot)应用,它们能解决许多问题,从生产力层面到娱乐层面,从学生用户到上班族用户皆可各取所需。然而,聊天机器人只是生成式AI应用的第一步,虽然很有趣,但只能解决有限的问题;就像绕地运行的宇宙飞船是人类航天事业的第一步,没有人能否认其重要性,可是航天事业的发展最终远远超过了这个“第一步”。

今天,我在苏州参加了一年一度的百度移动生态万象大会。与去年一样,今年的大会焦点也是AI,但是具体讨论的内容大不相同。百度集团资深副总裁、MEG事业群负责人何俊杰发表了题为《让智能体人人可用》的主题演讲:“智能体就是生产力,这是每一个放大杠杆、撬动红利,成为超级个体的时代机遇。”

最近我恰好也在研究智能体,这个概念在我刚刚写完的关于AI的新书中占据了重要位置。所谓智能体,其英文名称为AI Agent,有时也翻译为“AI代理”。根据AI业界通用的定义,智能体是一种能够与环境互动、收集数据,利用数据去自主决定完成预设任务的计算机程序。与单纯的AI聊天机器人相比,智能体最大的特点是自主性:人类只需要交给它一个最终目标,由它自行拆解目标、获取相关数据资源、反馈结果;所以它能够完成更加复杂、更加模糊的任务。而且,智能体能够把AI与各行各业的传统应用结合起来,创造出更多的、适合垂直场景的AI应用,从而大幅度提升生成式AI的实用价值。

在万象大会上,何俊杰列举了多个基于百度生态的“智能体案例”,其中给我留下印象最深刻的有两个。第一是订机票的准点率:从北京出发到苏州参会,哪个机场、哪个航空公司的准点率最高(附带说一句,苏州本地没有机场,大部分人会选择飞到硕放)?综合准点率、价格、机型等多项因素考虑,大概就能推断出应该预定哪个航班?这是一个非常复杂的问题,过去需要打开很多网站和APP,甚至做复杂的笔记;现在借助百度搜索入口,可以一步到位地搞定数据查询和分析,并且以图表的方式直观地呈现结果。这就是一种基于复杂数据的智能体!

第二是高考填志愿,这是一个远比订机票还要复杂、可以决定一个人终身命运的重大应用场景。报志愿既是个脑力活,也是个体力活,每年都把千千万万的家长和老师“卷”得苦不堪言。过去几年,许多互联网应用都推出了“高考志愿参考”功能,有些是基于人工编辑,有些是基于算法收集内容。今年,百度上线了智能体“AI志愿助手”:在某一特定省份,600分能上什么大学?对于某一具体考生,可冲击、较稳妥、可保底的大学分别有哪些?除了学校实力和专业因素,地理位置、食宿条件乃至校园风光等细节,同样应该纳入志愿填报的考虑范围。现在,考生及家长只需要提出正确的问题,让智能体去收集数据、给出答案就可以了。

上面列举的场景都有一定的生产力应用色彩,其实在泛娱乐场景,智能体的适用面也相当广泛。今年又到了欧洲杯之年,相信很多人跟我一样,早早开始畅想坐在电视机前、就着啤酒和小龙虾享受足球比赛的美好夏日时光。欧洲杯的赛程是什么样的?根据我自己的工作日程和作息时间,我可以观看哪些比赛?参赛球队的基础信息、球员数据去哪里找?有没有既专业又有趣的赛前预测、赛后分析可看?这些需求,都可以借助智能体去完成。像“懂球帝”这样的体育垂类智能体,借助其社区积累的UGC内容,还能在比赛过程中向球迷提供真人风格的“看球陪聊”服务——有过深夜独自看球经验的人应该知道,这样的陪伴是多么珍贵难得!

只要稍微了解生成式AI的人,应该都不会质疑智能体是AI的未来。我还想补充一点:智能体在很大程度上可以视为搜索引擎的延伸和升级,所以尤其适合像百度这样以搜索为核心业务的平台公司。还是从上面的两个例子出发,在生成式AI诞生之前,我们是怎么做出订机票、高考填志愿的决策的?我们会参考很多很多网站、应用、社区的标准化和非标准化资料,不过搜索引擎仍然是解决问题的出发点。我们会尝试不同的关键词,顺藤摸瓜式地牵出大批信息来源,然后基于新的信息再次修改搜索关键词,由此一而再、再而三,直至得出大致满意的结论。当然,有些人会选择使用相关APP内部的搜索功能,但那在本质上仍是一种小型的、相对垂直的搜索引擎。

在生成式AI的时代,搜索引擎可以继续扮演“智能体中枢连接器”的角色。通过百度APP的“互动频道”,我们能随时随地调出各种各样的智能体,解决实际问题。还是以上文提到的高考填志愿为例,在百度APP输入“高考”二字,点击进入“互动”,就能找到至少五个与此相关的智能体可供试用;随着高考日期的临近,供选择的智能体肯定会越来越多,或许面向不同省份、不同科目和定位的学生,都会有人开发针对性的智能体。等到考生填报志愿完毕,其身份转变为大学生了,大概也会通过智能体完成对大学生活的适应过程?基于AI大模型搭建自己的智能体,迟早会成为各大高等院校的一项重要任务,就像多年前开设官网、BBS和社交媒体账户一样。

所以我们可以理解,为什么微软和谷歌不约而同地选择以自家旗下的搜索引擎为AI大模型应用的首要立足点;微软Pilot最早只是必应搜索引擎的一项互动功能,Gemini(原名Bard)也是作为谷歌搜索引擎的配套功能发展起来的。业界一直猜测OpenAI想要发布自己的搜索引擎,至于为什么迟迟不发布,恐怕是为了避免冲击其股东方微软的利益。有人觉得生成式AI会导致搜索引擎的衰落乃至消亡,这个观点是片面的;正确的说法应该是,“传统的”、没有AI技术加持的搜索引擎已经走到了尽头,而得到了AI赋能的搜索引擎的新时代才刚刚开始。

在国内科技大厂当中,百度是最早对生成式AI技术做出深入探索的——早在2021年12月就发布了2600亿参数规模的Ernie 3.0 Titan大模型,它是国内第一个千亿参数大模型,也是目前文心一言系列大模型的“前辈”。百度的应用生态中沉淀了海量的、高质量的中文数据;百度不缺乏AI相关的算力储备,围绕AI的开发环境和开发者社区建设也相当成熟。熟悉国内生成式AI产业发展的人,都不会质疑百度在AI大模型技术方面的实力和历史积累;人们的意见分歧在于,百度能否将自己的技术优势有效地转化为应用优势?我的观点是:关键在于它能否建立起庞大的、蓬勃发展的智能体生态。

因此,文心智能体平台(AgentBuilder)成为了万象大会的一个焦点:百度希望跑通从开发、到分发、再到变现的路径。在开发上,支持自然语言交互、支持开发者调用自定义插件实现指定功能,从而把开发门槛降到了最低;在分发上,百度搜索每天的几十亿次用户请求本身就是良好的智能体流量分发池;在变现上,围绕百度内容和电商生态,也有很多文章可做。目前文心智能体平台已经有16万多开发者和5万多家企业入驻,覆盖了100多种应用场景。用户习惯的养成和开发者生态的培育,是两个彼此促进的过程,智能体越丰富就越会促进用户依赖智能体,反过来又会激励开发者创造新的智能体——这就像是“先有鸡还是先有蛋”的关系。

对于人类社会而言,生成式AI的万里长征才走完了第一步,智能体的曙光更是刚刚在地平线上露出一个轮廓。我相信,经过不太长的时间,大部分白领的日常工作将在多个智能体的支持之下进行,或许每天上午的第一件事情就是向不同的智能体布置任务,然后在当天的不同时间段(有些复杂任务可能延续到几天后)总结智能体的汇报。在遥远的未来,智能体终将具备与外界物理环境互动的能力,成为科幻小说中描写的“智能机器人”,帮助人类进行各种体力劳动。久而久之,智能体内部终将形成某种组织结构,多种面向垂直场景的智能体可以组合为全能智能体,甚至出现主要由智能体构成的大型企业——我们这一代人完全可以看到上述愿景全部成为现实。

千里之行始于足下。百度CEO李彦宏曾说:“智能体可能是未来离每个人最近、最主流的大模型使用方式。”所以对于整个生成式AI产业来说,智能体既对应着“足下”,又对应着“千里”:当前能够实现的是比较简单、探索性的智能体,未来终将实现的是高度复杂、高度成熟的智能体。我也很欣赏今天万象大会上何俊杰的一句话:“如果说大模型是一头‘性能怪兽’,那么普通人驾驭它的缰绳就是‘智能体’。”

今日长缨在手,何时缚住苍龙?这既是互联网大厂的机会、是应用创业者的机会,也是我们每个人的机会。未来已至,让我们不仅观察、见证这一切,也大胆拥抱未来、成为未来吧!

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

  • 小福哥儿
    06-01
    小福哥儿
    又能怎么样?能独霸市场?还是能咋滴?能让手机变形?你妈妈的,也不看看资本现在还甩不甩百度
发表看法
1