“火热”的WAIC:25款人形机器人,与数不清的大模型|甲子光年

甲子光年
07-04

最“热”的一届WAIC。

作者|赵健 八度

上海正午40度的高温,没能阻挡大家参加世界人工智能大会(WAIC)的热情。

在WAIC开幕的第一个下午,上海世博中心几乎每一个论坛都挤满了观众。

无问芯穹的AI基础设施论坛现场

在会场外,WAIC的门票一票难求,不少人懊悔错过了早点买票的时机。

根据官方数据,本届WAIC有500余家企业确认参展,市外企业和国际企业占比超50%,展品数量已超1500项。

今年的WAIC有两大看点,一是上演了现实版的“百模大战”。去年很多AI公司还在观望,甚至还没有诞生。而在WAIC上你可以一口气看完主流市场上99%的大模型——月之暗面、零一万物等头部厂商没有参加。

除此之外,Minimax、百川智能、智谱AI、阶跃星辰等“大模型新势力”,以及百度、阿里巴巴、腾讯、华为、商汤科技、科大讯飞、中国移动、中国联通、星环科技等产业头部玩家悉数亮相。

其中,MiniMax创始人、CEO闫俊杰还在现场向“甲子光年”等媒体透露,MiniMax将在下个月发布AI视频生成产品。

不过,大模型看多了可能也会审美疲劳。有不少观众现场表示,每一家的产品看起来“大差不差”。

第二大看点非人形机器人与具身智能莫属。

本届大会展览重点打造人形机器人专区,展出人形机器人25款,现场发布全球首个全尺寸开源公版人形机器人青龙,以及国内首个全尺寸人形机器人开源社区。特斯拉首发Optimus二代,宇树科技展示国内首款实现奔跑功能的全尺寸通用人形机器人H1。傅利叶、达闼、云深处科技等企业也带来总计超20款智能机器人。

现场还有海外各地的采购团,比如巴西、日本等等。采购团的热情很高,看到新奇的机器人都纷纷拿出手机拍照。

今年的WAIC,很可能是“最火热”的一届,无论是物理意义上,还是产业意义上。

1.具身智能成大热门,人形机器人“竞相比武”

深入到WAIC的H1展位,各机器人公司都开足马力,展现自家王牌产品,真正秀出了最硬的肌肉。具身智能(Embodied AI),成为展览中的大热门。

几乎每家机器人公司都在宣称自己做的是具身智能。“具身智能就是有一个身体,再加上一个机器人智慧的大脑。”一位展商直白地向来宾解释。

几十款人形机器人来到现场,让人饱和地感受到这一年多AI大模型对机器人行业的颠覆。

在人形机器人先锋阵列展位面前,挤满了人围观这“十八金刚”——由十八位人形机器人组成,它们各自都有一个代号,分别是青龙、X02-LITE、清宝机器人、智元远征A2、傅利叶GR-1、电科机器人一号、星动1号、开普勒先行者K1、小蟹、夸父4代、XR-4、H1、Song、光华一号、钛虎瑶光。

当它们同时向来宾挥手时,场面颇为震撼。

特斯拉也带来了它的当家花旦——人形机器人Optimus,在直立行走的基础上,Optimus现在的行走速度提升了30%,十个手指也进化出感知和触觉。

目前,它能轻握脆弱的鸡蛋和搬运沉重的箱子。现场透露,最近,Optimus已经在特斯拉工厂做一些实用的工作,比如借助视觉神经网络和FSD芯片,模仿人类操作进行电池的分拣训练。

明年,特斯拉将会生产超过1000个Optimus的“同胞”们一起完成生产任务。

在现场,逐际动力双足机器人P1以全新ID首发亮相,观众与逐际动力双足机器人P1热情互动。即使观众多次用脚踹它,它仍然屹立不倒。

Kuavo(夸父)是国内首款搭配鸿蒙操作系统的全尺寸人形机器人,重量约为45公斤,步速最高可达4.6千米/小时,快速连续跳跃高度超过20厘米。

这也是最早产业化落地的一款机器人,由乐聚公司打造。其工作人员介绍,这款机器人今年已经量产,总共卖出去的数量超100台,场景包括工业、科研等等。

达闼机器人则直接在现场全面预售百台新品—具身智能人形机器人XR4,它自带海睿云端大脑、50+自由度、RobotGPT具身智能大模型,报价39.9万元起。

现场的机器人公司分为两派,一派是“为了具身智能而生”,另一派则是老牌公司,抓住了这波大模型的红利,顺势开启了公司的第二曲线。

前者以穹彻智能为代表,作为创立仅半年多的一家公司,这次带来了4款机器人demo,展现了包括黄瓜削皮、打扫卫生、叠衣服等日常场景。

工作人员介绍,黄瓜削皮这个动作,无需提前建模,依靠具身世界模型和以力为中心的高精度操作模型等技术突破,就能使双臂机器人对黄瓜等不规则曲面物体进行刮削操作。

开普勒机器人则是在去年8月份创立,当年年底就推出了先行者系列通用人形机器人,包括先行者K1、S1和D1三个型号,计划今年下半年量产先行者K1人形机器人,预计售价在3万美元。

黄色的人形机器人,在展会中格外亮眼。

星海图去年5月创立,定位是一家具身智能公司,愿景也围绕这个而来:“部署100亿台智能体,服务100亿全球人口”。现场展示了他们的全尺寸双臂仿人形机器人R1。

星动纪元也是去年8月才成立,很快就推出了全链路技术突破的具身智能人形机器人——小星,它全身包括灵活手在内有34个自由度,能够在不同类型的地面上稳步前进,现场展现了它爬长城的视频。

擎朗智能(Keenon)早在2010年成立。2014年,公司就发布了第一代轨道餐厅服务机器人“小朗”。如今,借着东风,公司与微软Azure云服务合作,计划将其基础大模型能力接入到擎朗智能的旗舰机型T10,以此提升机器人在任务理解、感知决策、分析推理等方面的具身智能技术水平。

天链机器人创立得更早,2009年就在四川绵阳创立,最早做精密谐波减速机,再到做机械臂、协作机器人等。今天在现场,其人形机器人的一整套丝滑动作,迎来瞩目。

据介绍,这款人形机器人——天链T1全产业链自研自产,8km/h的最大行走速度,已经在教育、工厂、养老、军工、高校研究院等场景中有了应用,价格在50~100万元左右。

傅利叶携进阶升级的人形机器人GR-1及下肢外骨骼机器人ExoMotus M4亮相大会。傅利叶发布了首款全尺寸人形机器人GR-1,并率先实现量产交付。经过一年成长,GR-1在环境感知、仿真模型、运动控制优化等方面实现进阶升级。

傲鲨智能的外骨骼机器人让很多人簇拥体验,产品覆盖上肢、腰部、下肢、全身等,在矿山、汽车、航天、物流等重体力劳动场景中有了应用。

云深处专注于四足机器人的研发及应用,现场,这款名为“绝影X30”的较大四足机器人展现了它灵活上下楼梯的样子,它能够在-20℃到55℃的极端环境下作业,也适用于电力巡检、应急救援、消防侦查等领域。

2.大模型大同小异,多模态全面开花

今年的WAIC,最受关注的大模型“六小龙”来了四家——MiniMax、百川智能、智谱AI、阶跃星辰,而月之暗面、零一万物没有参加。

下午4:30左右,MiniMax创始人&CEO闫俊杰现身MiniMax展台。他对“甲子光年”等媒体透露,MiniMax即将在下个月发布AI视频生成产品,在海螺AI里即可体验。

闫俊杰表示,AI视频生成产品的发布背后,离不开“基座大语言模型”能力的巨大进步,甚至可以说它是做大语言模型过程中“顺手做”的产品。他还以OpenAI为类比,GPT系列的大语言模型团队有几百人,而Sora团队只有十几人。

MiniMax创始人&CEO闫俊杰

另一家大模型独角兽阶跃星辰,在今天发布了Step-2万亿参数的MoE架构大语言大模型,是国内极少数能做万亿参数模型的AI公司。与此同时,阶跃星辰还发布了Step-1.5V多模态大模型、Step-1X图像生成大模型。在展台现场,阶跃星辰还与上影合作,在WAIC现场发布了《大闹天宫》AI 互动体验——“测测你是哪路神仙”。

商汤科技也发布了一款面向C端用户的可控人物视频生成大模型Vimi,被评为“镇馆之宝”之一。Vimi基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

智谱AI没有发布新模型,但展示了一个智谱小镇,集合了智谱大模型开放平台赋能公共事务、消费、文旅、医疗、保险、教育、汽车、金融、工业等多个行业场景的典型案例。此外,智谱清言还发布了AI作品《清言画册》首刊。

百川智能也没有发布新模型与新产品,主要展示了Baichuan系列通用大模型、AI助手百小应、内测版医疗应用AI健康顾问以及百川的智能To B解决方案。

除了大模型新兴的“六小龙”,H2展馆最大的看点其实是各个大厂,他们的展台普遍比其他展台大一倍,展台的设计也更加从产品侧与用户侧思考,尽可能让用户对AI有切身的感知。

蚂蚁集团在现场展示了三款AI助手——支付宝智能助理、AI金融助理、AI就医助理。其中支付宝智能助理是支付宝推出了对话式AI助手,围绕用户的吃、喝、行、游、办事、买票、娱乐等数十种生活场景,比如当用户向它说“帮我点一杯美式咖啡”,它可以自动下单。支付宝智能助理也被评为本届WAIC“镇馆之宝”之一。

蚂蚁集团大模型应用负责人顾进杰也分享了蚂蚁三大核心AI应用以及背后的思考。他表示,大模型进入应用时代,如何用最先进的技术做最普惠的服务,是蚂蚁AI一直在攻关的方向。

阿里巴巴在展区设计了一系列体验活动,包括“定制个性化声音”、“高校百万创作人”工具互动、阅读“追星星的AI”公益绘本、观看“动态版韩熙载夜宴图”、创作“涂鸦作画个性扇子”以及体验“亚运AIGC明信片”等特色打卡互动展项。阿里的通义灵码,也被评为“镇馆之宝”之一。

大模型不只是互联网“大厂”特色,一些互联网“中厂”也在积极参与,比如快手、B站、Soul等。B站展示了其自研的相对冷门的Index系列大模型,而快手展示了前段时间火爆外网、与Luma AI同期竞争的可灵视频大模型。

华为是本届WAIC展台最大的厂商,现场展示了华为“升腾AI全流程使能平台、盘古大模型以及在各行各业的AI实践。在下午展台刚开放不久,正大集团董事长谢吉人及其团队在华为的展台参观。

现场参展的大模型还包括:百度“文心大模型4.0”、腾讯“通用大模型—腾讯混元”“腾讯云行业大模型——MAAS”、中国电信“星辰大模型”、中国联通“元景‘1+1+M’大模型”、蜜度“蜜巢政务大模型”“文修智能校对大模型”、云知声“山海大模型”、面壁智能“面壁MiniCPM旗舰端侧大模型系列”、蚂蚁云科技集团“以正教育大模型”、中科创达“创达魔方大模型”、智子引擎“通用多模态大模型Awaker”、考拉悠然“悠然多模态产业通用大模型”、“新壹视频大模型”。

此外,微软、戴尔科技、联想、中兴通讯、金山办公、猿力科技等重点发力端侧应用,展现模型落地前景。

在AI应用落地侧,C端产品集中在各类对话助手、文生图、文生视频产品、MiniMax的星野等角色扮演类产品。行业发展到今天,这些产品的新鲜感早已褪去,以至于现场有观众参展下来表示,每一家的产品都大差不差。

但在B端产品,已经有不少场景在应用大模型了。在H1展馆,会随处可见各种AI落地B端的案例。

除了行业垂直的解决方案,也有一些针对特定领域的AI产品出现,其中办公场景已经成为一个热点。

比如,猿辅导旗下定位“AI时代设计工具”的Motiff妙多,首创AI复制、AI布局、AI设计系统创建、AI设计系统维护、AI一致性检查等多个AI功能,是国内首个自研图形渲染引擎的界面设计软件。

庖丁科技是“文档智能”领域的领航者,提供从基座、审核、撰写到开发工具的全流程文档处理SaaS服务和企业级应用。

让大模型更懂行业,让行业用上大模型。这届WAIC,正在生动诠释这一点。

(文章图片由“甲子光年”现场拍摄)

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法