百融云创的AI叙事:语音交互驱动生成式AI迸发?

一财网
09-14

不可否认,这是一个AI的黄金时代。以大模型为核心的时代发展浪潮持续汹涌澎湃,产业链上的齿轮频繁轮动,最近指向了语音交互领域。

苹果本周发布了首款基于AI功能设计的iPhone,一大重头戏便是Apple Intelligence有可能让语音助手siri焕发新生。国内的荣耀也在日前推出了搭载语音交互智能体的新机。

一系列智能产品的问世昭示着通过内置大模型,以语音交互的方式直达用户需求的业态正在成为AI应用和服务新生态。

但事实上,语音交互的魅力早已在产业界悄然酝酿。走在国内第一梯队的AI科技公司百融云创(百融云-W,6608.HK)自2017年末开始立项研发基于多模态(文本+语音)技术的语音交互系统,旗舰产品Voice-GPT自2021年开始实现大规模商用。

可以说,在百融云创的AI叙事中,语音交互是最浓墨重彩的一笔,其在公司的业绩表现中也扮演着至关重要的角色。

突破性创新:“意图和情绪识别”决定智能交互新范式

基于语音交互的对话式人工智能已经发展多年,但因语音对话技术不够成熟等原因,导致在交互中会出现答非所问、不能进行多种语言切换、不能对于相近意思展开联想等等弊端,使得很多产品沦为鸡肋般的存在。

即便如苹果、谷歌等科技巨头,语音助手也只不过是锦上添花的一项功能,无法直接产生收入。但是百融云创硬生生在语音交互这条路上走出了一条规模化、产业化的变现新路。近四年间,百融云创经调整后的净利润年均复合增速高达131%,盈利能力远超同行。

资料显示,百融云创在2017年借助Transformer注意力机制拟合人机交互方式,同时融合在语音识别、海量语音数据计算等领域的技术沉淀,推出的爆款产品AI智能语音机器人(Voice-GPT)可以满足混合语种、复杂环境、多轮交互等更为深层的任务需求,现已在金融、电商、租赁、物流等多个行业有效落地。

除了蕴含通用类语音交互技术外,为了让Voice-GPT更加拟人化,百融云创的技术团队基于行业Know-how持续加强特色研发。例如为了在交互中实时洞察用户的真实需求,百融云创自主研发了一种语音质检分析方法及系统,可以“量化”用户情绪波动及有效识别用户意图,并且可以在通话结束后的几百毫秒内形成分析报告。

伴随着AIGC时代的到来,百融云创将自研大模型(BR-LLM)通过模型量化、蒸馏和分离式推理架构等技术集成到语音交互之中,可以显著提升语音识别的精确度、响应速度和对场景的适应能力。根据百融云创日前发布的2024年中期报告,在大模型基座之上运行的Voice-GPT能支持每日5000万通以上智能语音沟通,延时低到人类无法察觉的500毫秒以下,在音色、情感、语速、对话层面能够实现“真人级”互动体验,对于客户语音识别的准确率能达到99%以上。

在Voice-GPT等高效能工具加持下,百融云创的第二增长曲线BaaS(业务即服务)加速在财富管理、智能运营、智能营销、客户管理等场景中渗透。据悉,借助Voice-GPT可以将商业机构的用户管理效率有效提升16倍。中报显示,BaaS金融行业云收入5.89亿元,拿下同比20%的高增幅。

锚定下一个入口:以语音交互为主的AI agent

率先卡位语音交互这一赛道,百融云创通过生成式AI技术和服务帮助商业机构降本增效,并实现资产运营成果的有效转化。但该公司并未止步于此,近两年,百融云创锚定更高维度的技术赋能,成为业内最早一批布局AI Agent、多模态等领域的AI科技公司。

百融云创CEO张韶峰日前表示,全新升级的语音交互大模型Voice-GPT是AI Agent深度场景化的领先实践。

从技术逻辑上看,AI Agent是一种能够感知环境、进行决策并执行动作的智能体,它在思考与行动方式上比Copilot更高一层,和人类极其相似,是能感知、能理解、能行动的全职助手。

为了让Agent在商业机构实现更加低成本、高质量有效落地应用,百融云创在大模型基座之上,搭建了一站式开发平台Cybotstar(赛博坦),通过结合完善的插件生态;及本地语料生产体系(知识库)等,对外输出AI Agent等服务,从而帮助商业机构实现更加便捷的AI原生应用开发。

百融云创相关人士表示,Cybotstar几乎完美适配企业端的任何工作流(Workflow),不局限于特定行业、特定场景,它能够精准理解企业用户的需求,降低人为干预,帮助实现任务的自动化与有序处理,从而助力企业高效运营。

以代理运营模式为例,通过Cybotstar可以实现如客户服务、数据分析和流程管理等繁琐日常任务的自动处理,同时还可以根据业务场景灵活调整策略,优化资源配置,实现更智能的业务管理与扩展。

展望未来长期布局,张韶峰介绍,以融合智能语音交互的3D数字人为例,该端云协同的多模态智能体已经开发出第一个商业化版本,并已经与客户进行意向沟通,将广泛适配于银行大厅接待、零售百货导购等多元应用场景。

根据德勤报告,预计到2030年,国内智能语音商用市场规模将达到1452亿元,其中企业级应用占比过半。机构分析认为,百融云创一方面在加厚AI语音底层技术城墙,另一方面,通过内嵌大模型的Agent打开端侧的轻量化、规模化部署生态,将AI产品及服务深度渗透在千行百业的营销、运维、客户管理等流程中,长期成长前景可期。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法