对话香港科技大学教授贾佳亚:AI大模型的巨大缺陷是没有人格和悲喜|钛媒体AGI

钛媒体APP
09:45

香港科技大学讲座教授、思谋集团创始人、董事长 贾佳亚

“过去70年AI技术有三个历程,高潮和低谷都出现在2000年之前,也就是我做研究的初期。那时谁敢说自己做AI,他一定是一个‘骗子’,因为没有路径可以实现(AI)。”

8月21日-25日举行的2024世界机器人大会上,香港科技大学讲座教授、思谋集团创始人&董事长贾佳亚在演讲中表示,2012年之后,大众才认知到AI技术重要性,且从机器学习走向深度学习、大模型方向发展。而现在大家却担忧AI能不能维持住人类的工作和“饭碗”,因此这是一个真正走向AI的新未来。

会后,贾佳亚向钛媒体App等坦言,当前“具身智能”概念被过于炒作,这一技术自身还需要很长的时间才能实现。机器人的未来在于跟人相关,就现在的技术阶段而言,人们应该按照“长坡厚雪”的方式去看待这些AI硬件产品。

贾佳亚强调,当前 AI 大模型存在一个巨大缺陷,就是你认为它没有人格或者没有“机格”(机器的人格),你不知道它的悲、喜。但从长期看,AI 和机器人都需要从落地和场景去发挥应用创新。

“所以机器人的发展一定是可期待的,未来很有意思,但是现在这个阶段,我们还是‘饭得一口一口吃’。”贾佳亚称。

据悉,贾佳亚是香港科技大学讲座教授(Chair Professor)、IEEE会士,计算机视觉、AI 与计算机影像学等领域顶尖专家。他发表了200多篇论文,引用量超过70,000次,H指数超过100,多次入选美国斯坦福大学和爱思唯尔数据库发布的《终身/年度全球前2%顶尖科学家榜单》(World's Top 2% Scientists)。

在创立思谋之前,贾佳亚曾执掌腾讯云与智慧产业事业群(CSIG)旗下优图实验室(X Lab),为腾讯 AI 技术体系打下“坚实基础”。2019年,贾佳亚创立智能制造企业“思谋集团”(SmartMore),并且仅用18个月迅速成为独角兽企业。

截至目前,思谋科技已融资超过20亿元,投资方包括IDG资本、松禾资本、红杉资本中国基金、真格基金和联想创投等。同时,思谋已服务近300家全球大型制造业企业,涵盖高端消费电子、新能源、汽车、视频内容制作及提供商等。2024年6月,香港特区政府全资的港投基金首次战略投资的思谋科技。

贾佳亚表示,大模型的训练门槛非常高,中国和美国两大区域都训练出了非常多的大模型,这些大模型的能力极强,花费极高,GPT-4拥有1万多亿参数量,可容纳容几百个美国国家图书馆内容,同时,它大概消耗2500张A100的计算卡,去年上半年硬件的采购金额达9亿美金以上,今年这个数字至少翻了2-3倍。也就是说,每个公司可能要投入在20亿美金左右去采购更多的计算资源。

因此,在贾佳亚看来,AI的发展需要算力成本不增加下提高性能、模型质量以及商业化,从而基于大模型基础能够帮助到工业界以及机器人这个行业,形成产业价值。

贾佳亚对钛媒体App等坦言,大模型的思考上限就是机器人思考上限。因此,AI技术提升才能让机器人、具身智能硬件性能更好,整个过程仍需要漫长的周期。

“所以,当你觉得大模型本身也还存在很多缺陷,很多地方就是有80%是做对的,20%是错的,可能在一个语言系统交互系统你就认了。但是如果在机器人上面,你20%的机会,你做错事情你或者把他骂到,然后把你家本来是干干净净的,后来整得很乱,或者把你该要的东西给扔了,你肯定怒火中烧,你肯定会把这个东西就给丢掉了,或者是直接去投诉或者去卖掉了。所以,这个事情的原因就是因为太早去定义一件事情,这是不对的。”贾佳亚称。

谈到AGI未来与机器人的关联,贾佳亚指出,“人可以定义未来,但我们看到了很多问题,这也是为什么现在学术界一直要做研究事情,因为我觉得不管你认为,这是一个‘白盒子’还是一个‘黑盒子’,还是说这个过程我能理解还是不能理解,这都是一个很有意思的研究方式。我最近会收到非常多来自亚洲地区最顶级的一些学生愿意来读AI的博士,至少在现在看来,这已经产生一个巨大的机会,这个机会如果就像解决,我们认为就像早年时候解决这种汽车动力,从汽油车变到电池电池的问题能解决,车型转换就很自然的从一个旧能源车变成了新能源车,AI的发展也是如此,你肯定是一个阶段,第一代、第二代、第三代、第四代,从旧AI变成新AI。我想说,这是一个机会。”

谈及算力成本高昂,贾佳亚向钛媒体App表示,“我们从来不会认为,你用1万张卡训练出来,这个系统一定会比5000张卡训练的好,我们只觉得1万张卡你才训练出一个系统。所以我每天和我学生讨论,我说就500张或1000张卡,你们比如在推理、编程等领域,能不能把这个能力推到跟GPT-4类似的效果,从而降低我的搜索空间,而且把计算卡的利用率逐步提高。这个是一个研究人员最有意思的工作。甚至是未来,我们可能会想说,一个更加简单的操作、更有效的操作,让1/10的计算量就能够达到现在这10倍计算量所达到的传统方法的效果。”

贾佳亚强调,当前的 AI 大模型技术处于从能用到可用的过程阶段,已经能够在工业、产业界达到一定效果,不一定非得“百模大战”。一旦数学能力提升跨越了“可用”这条线之后,大家也就是比拼价格,全球不断“内卷”和竞争。

今年4月,贾佳亚团队提出多模态开源模型Mini-Gemini,提供2B到34B版本,最强模型在多个指标上相比 Google Gemini Pro 甚至 GPT-4V 都不遑多让。更早之前,贾佳亚是全球最早提出大模型“长文本序列”技术的团队负责人之一。

贾佳亚认为,当前 AI 机器人的数据、实时性都不够完整,整个“具身智能”体验也不够好。

“我现在觉得,我们自己也考察过非常多的机器人公司,因为我自己做大模型,我们工厂也要去买很多机械臂,但是我看到,很多演示是演示的很好,但是你真的跑去跟他说这个东西,你真的做大模型控制(机器人量产)了。那不是控制,都是我们编程编好的,然后就给你演示一下,大家都照着演示这个东西,这个也不是什么秘密。”贾佳亚称。

谈到 AI 人才和劳动力短缺话题,贾佳亚表示,当前劳动力密集产业存在“空心化”和断层问题。

他认为,当前很多年轻人不愿意去做劳累的体力活,所以市场急需 AI 和工业机器人产品能商业化和规模落地,以至于未来5-10年年轻人可以知道怎么去做大模型,如果经验不够,年轻人可以迅速的把大模型能给沉淀起来,从而产生生产力价值。所以,现在全社会需要培养学生非常强的编程能力,这是十分重要的。

展望未来,贾佳亚直言,AI 大模型将进入下一个阶段,需要发展智能体技术,让大模型能够真正体验和实践。而从机器人角度看,硬件应该还是按照“长坡厚雪”方式去看待,它每一年都会有进步。就像比尔·盖茨在1995年对科技业的断言,对今天人形机器人行业也同样适用:

“我们总是高估了未来两年的变化,却总是低估了未来十年内的变革。但无论高估低估,我们都不能无所作为。”

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法