影智科技唐沐:人形是累赘,具身智能并不缺少落地场景
马斯克、黄仁勋等人的站台,让具身智能迅速蹿升为2024年最受资本追捧的赛道之一。
复盘具身智能赛道过去一年融资事件,人形机器人是出现频率最高的词。或许是受《机械姬》、《西部世界》等科幻作品的影响,人们本能地认为具身智能应该拥有双手双脚、面部表情等设计。
但影智科技创始人唐沐对此并不认同:“具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的’人形’。当前市场对人形机器人的追捧更多是概念化,而非实用主义。”
作为QQ头像、微信表情包等现象级符号的缔造者,小米路由器、小爱智能音箱等亿级爆款产品的掌舵人,唐沐以其敏锐的洞察力和创新的产品思维,打造了一系列国民级产品。
与那些还处于实验室状态、“吊着威亚”展示的人形机器人不同,影智科技的xbot咖啡机器人已经是各种科技展会上的明星,每次体验机器人制作咖啡的观众都排起了长队。
具身智能为什么必须回归需求导向?这种理念为机器人带来了哪些颠覆性的改变?又有哪些成功落地的应用场景?带着这些问题,我和影智科技创始人唐沐进行了一场深度对话,尝试打破外界的刻板印象,找到通往具身智能正确答案。
01 机器人的进化路径:不是从“像人”开始,而是“更有用”
2023年走进大众视野的具身智能,正处于“八仙过海” 的时期,吸引了一大批用人形机器人求解具身智能的创业者。
而支撑他们投身人形机器人的动机,可能只是一场不确定的“风”:当马斯克开始做人形机器人之后,市场、资本机构都认为必须加快入场,不能等特斯拉真正做出来了大家再去追。
有着20多年产品经验的唐沐,并不苟同这种追风现象。
2003年,唐沐加入 $腾讯控股(00700)$ ,着手组建了腾讯用户研究与体验设计中心(CDC),负责QQ、QQ电脑管家、QQ音乐、QQ空间等亿级用户的产品体验设计。外界所熟悉的QQ头像、微信表情包等均出自唐沐之手。
2013年,本着“做一款自己的产品”的想法,唐沐加入 $小米集团-W(01810)$ ,历任智能产品部总经理、小米生态链副总裁,带领团队开创了小米路由器、小爱音箱两条亿级产品线,以及VR、AR、机器人等领域的技术探索。
多年后,唐沐离开小米创办了影智科技,天使投资人名单中不乏微信之父张小龙、小米联合创始人林斌、黎万强、黄江吉、洪锋等外界耳熟能详的人物。
影智科技的标杆产品,正是前面提到的xbot咖啡机器人。彼时,唐沐就意识到,机器人需要遵循技术的底层逻辑,在正确的时间做正确的事,而非奔着一个遥远的目标给投资人画饼。
这样的履历,让唐沐有足够的底气选择不盲目追风,坚持自己对具身智能趋势的理解和洞察。
当其他创业者为人形机器人枕戈待旦时,堪称“国内具身智能消费机器人第一人”的唐沐,没有沉溺于对人形机器人的空洞想象,理性地讲述了自己对机器人演进路径的独到见解:
X1阶段是工业机器人,强调动作的人工编排,用于工厂内的高度结构化任务;
X2阶段是消费机器人,结合人工与AI进行任务编排,比如学习咖啡师的技艺训练机器人的拉花技巧;
X3阶段是具身智能消费机器人,拥有视觉、听觉、触觉等多模态感知能力,可以基于用户的个性化信息,结合消费场景和用户进行深层次互动,进一步提升服务质量和灵活性;
最后一个阶段才是AGI机器人。
和人形机器人广泛而模糊的目标不同,唐沐认为:机器人的进化路径,不是从‘像人’开始,而是从‘更有用’出发。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求,这才是技术发展的正确方向,就像让机器人做咖啡。
相比人形机器人在舞台上比心、跳舞等“炫技”,影智科技的xbot咖啡机器人让人记住的,是实打实的“新质生产力”:能够在75秒内复刻大师级的拉花咖啡技艺。
2021年举办的黑杯咖啡大师竞技赛上,xbot咖啡机器人和世界级拉花咖啡师同台竞技,并最终摘得了冠军。由于人类咖啡师的集体抗议,xbot咖啡机器人在第二年“被迫”当了评委。主办方先让xbot咖啡机器人做一杯拉花咖啡,然后让人类咖啡师还原,并根据完成度评分。
现在,xbot咖啡机器人已经不单单是效率上的降维打击,在大模型的赋能下重新定义了服务边界——从生产力工具跃升为兼具情感互动与个性化服务的咖啡智能体。
02 具身智能的现实价值:不是形态上像人,而是思维上像人
在 $星巴克(SBUX)$ 的品牌故事里,有一个重要的理念是“将顾客作为朋友”,咖啡师熟悉每一位顾客的名字和喜好,甚至在顾客进门前就准备好了他们常点的饮品,以此给予顾客在家和工作之外的归属感。
但在中国市场,这种归属感早已输给了人效二字:被一杯杯订单忙到喘不过气的咖啡师们,很难有精力和顾客建立有感情的沟通。咖啡店拼的是出单量和运营效率,而非顾客的体验感。
在唐沐看来,这正是具身智能的现实价值。
“X2阶段的机器人已在效率上实现对人工的降维碾压,而大模型的多模态感知与认知推理能力,将重新定义咖啡消费,不仅赋予了咖啡人情味儿,还拓展出了全新的消费场景。”
影智科技自研的xbot咖啡大模型已经应用到三类消费场景中,完美诠释了唐沐的理念:
一是AIGC“烘托”的仪式感和氛围感。
除了大师级的拉花技艺,xbot咖啡大模型带来了独一无二的咖啡体验:顾客可以扫码上传自己感兴趣的照片,通过AIGC技术生成自己喜欢的图像风格,让咖啡机器人用焦糖在奶泡上打印出相应的图案。
一杯咖啡满足的不再只是“提神”的需求,也是一种社交资本:情人节给女朋友买一杯印有玫瑰花图案的咖啡,在景点打卡时咖啡上印有刚拍的风景……让喝咖啡更有仪式感,并激发出消费者的社交需求。
二是多模态感知能力带来的情感体验。
当顾客走到咖啡机器人前点单时,可以智能识别用户身份和口味偏好,自动切换到顾客喜欢的数字人形象,而且数字人会主动和顾客打招呼,并推荐顾客可能感兴趣的咖啡品类。
在用户允许的情况下,咖啡机器人甚至可以通过声音和表情实时感知顾客的情绪状态,比如顾客表现出疲倦或情绪低落时,建议顾客多加一些糖来保持好心情,或者调整咖啡因浓度帮助用户提神。
三是千人千面的消费需求和健康管理。
得益于xbot咖啡大模型的认知推理能力,基于顾客消费数据的个性化消费知识图谱,顾客只需要一个类似“做一杯热带风情”咖啡的指令,咖啡机器人能够自动创作出符合顾客需求的咖啡,让顾客的需求不再局限于已有的菜单,而且能够根据自己的想法个性化定制。
xbot咖啡大模型还能为顾客制定健康管理方案,比如了解到顾客连喝了三杯咖啡后,推荐喝一杯有利于健康的乌龙茶。
如果说人形机器人追求的是形态上像人,唐沐的理念是思维上像人,让具身智能机器人像人一样和顾客打招呼,像人一样关心顾客的情绪。
唐沐进一步解释称:“具身智能还没有终极的答案,不代表没有可以参考的路径,譬如十年前的自动驾驶,如果按照当时预期的终极目标,到现在也没有实现,但并不妨碍L2.5、L3级别的自动驾驶能力上车。具身智能从发展到成熟的过程中,也存在大量可落地的场景。”
摆脱了“炫技”等表面追求的xbot咖啡机器人,可能不如人形机器人有话题性,却构建了更贴近消费场景的具身智能生态,打造出了更贴近当前社会需求高度契合的真实图景。
03 遵循商业化常识:人形可能会是累赘,优先解决高频刚需
对于具身智能的市场前景,外界有不少判断。
高盛曾预测称,在理想状态下,软硬件成本年均下降达到20%的话,人形机器人市场规模有望在2035年达到1540亿美元。
黄仁勋在媒体采访中坦言,“100年后大街上将到处都是人形机器人”,马斯克也在X上默契地回复,“人形机器人普及程度将是汽车10倍”。
面对具身智能的商业化问题,有别于动辄十年后、百年后的长远叙事,唐沐用一组掷地有声的真实数据给出了答案:
“目前xbot咖啡机器人在全球部署超过300台,包括博物馆、景区、商场、展会、图书馆等场所,两周前刚落地到70家万达影城。每台咖啡机器人日均制作的咖啡在200杯以上,最高的时候超过了350杯。仅在过去一个月,我们的营收已经超过2000万元。”
正在大规模量产的xbot咖啡机器人
唐沐对具身智能机器人的商业化构想,也随着xbot咖啡机器人的落地得到了充分验证。
比如在2023年成都大运会期间,成都的一家公司将xbot咖啡机器人“搬”到了大运会的运动员餐厅,24小时不间断运营。期间吸引了不少运动员拍照打卡,不乏意大利、巴西等对咖啡要求很高的国家的运动员。后台统计数据显示,xbot咖啡机器人在12天里做了4000多杯咖啡,主办方全程只安排了一个志愿者负责换料。
再比如北京首都图书馆的例子,在微博、小红书等社交媒体上,有不少人分享打卡首都图书馆的咖啡机器人,为机器人的拉花技能和个性化图案印花点赞。连唐沐都直言超出了预期:“一开始只是和首都图书馆联营合作,不小心成了图书馆的网红打卡点,每天运营10个小时,日均制作200多杯咖啡,只用4个月的时间就收回了成本。”
两个月前的国庆75周年庆典上,xbot咖啡机器人作为新质生产力的代表,出现在天安门景区,意料之中地成了新晋打卡点,每天都有不少游客排队体验。
咖啡机器人的商业化路径跑通后,唐沐并没有停下来。
除了直接销售咖啡机器人,影智科技正在全面发力机器人联营业务,探索咖啡服务之外的信息增值服务。围绕真实的场景需求,咖啡小站、无人快餐车等产品已经被排上日程,其中无人车快餐车上的机器人,可以制作咖啡、冰淇淋以及汉堡、沙拉等快餐。
被问及影智科技是否会进入更多场景、未来的边界在哪里时,唐沐的回答始终聚焦在场景化设计的理念:“所有的产品必须要在场景中设计,我们绝对不做臆想的,不会突然冒出一个idea就把它做出来。”
站在行业的视角上看,整个具身智能赛道似乎还未到谈论商业化的时候,不断有创业者带着激情进场,资本也愿意为一个美好的愿景买单。但看似繁荣的热潮背后,潜在的困境也如影随形,倘若没有未雨绸缪的商业化审慎思考,过于夸大未来而忽略当下,最终留下的往往是一地鸡毛。
见证了多次潮起潮落的唐沐,本着对国民级产品的执着,认为具身智能创业应该遵循商业化常识:“具身智能不等于人形机器人,在许多场景中,人形设计可能过于复杂且不具备效率,甚至会成为累赘,创业者应该以具身智能为核心,优先解决高频刚需问题,不要盲目追求形式上的人形化。”
04 写在最后
2019年中国的人均咖啡消费不到5杯,2023年的时候已经增长到16.7杯,一线城市甚至达到了100多杯。等待xbot咖啡机器人的,是一个潜力无限的千亿级市场。
作为一个蓝海市场的开拓者,唐沐笃定地表示:“我们的产品不是跟着潮流走,而是要用实力去定义潮流的方向。这或许是我这种‘大龄创业者’的特质吧,不会被理想冲昏头脑,也不迷恋概念上的‘炫酷’, 解决现实需求才是直接打破行业规则的王道。”
具身智能的大幕才刚刚拉开,已经站在浪潮之巅的唐沐坚信,随着人形机器人热潮退去,行业将迎来一场回归:从形式到本质,从概念到落地,具身智能将重塑更多行业,创造出前所未有的价值。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。