技术的百度:一场未完待续的冒险

诺贝尔物理学奖花落“AI教父”杰夫·辛顿(Geoffrey Hinton),一度在学术界和产业界掀起“人工智能算不算物理”的大讨论。

今天产业界的百花齐放很容易让人忽视,仅仅十年之前,人工智能这门年轻的学科还在争议中匍匐前进。辛顿对人工智能的意义在于,他的职业生涯就是这门学科的缩影,为后来者提供了一个可以量化的历史坐标系。

过去十多年里,人工智能的发展经历了三个关键节点:

·2012年,辛顿带着两个学生参加了ImageNet图像识别比赛(ILSVRC),以惊人的84%识别准确率夺得冠军。这个成绩深深震撼了学术界和正在投资人工智能的科技公司,神经网络在人工智能领域的地位从“之一”变成了“唯一”。《深度学习革命》中说:辛顿和他的学生改变了机器看待世界的方式。

杰夫·辛顿(Geoffrey Hinton)

·2017年,在谷歌工作的八位程序员经过数月的合作,创造了一种处理语言的架构,简称为“Transformer”,并在当年7月的一篇名为“Attention Is All You Need”的论文中描述了该架构。这篇划时代的论文,拉开了生成式人工智能的大幕。

·2022年底,ChatGPT横空出世,人工智能过去十年的发展浓缩在一个聊天窗口里,全世界见证了一个用美元和GPU堆起来的理想主义故事,也极其直观的感受到了人工智能身上散发着的下一个时代的气息。

短短十年时间,人工智能经历了万马齐喑后又爆裂般的成长,即便对前沿技术最敏锐的人也有可能漏掉它狂奔途中重要的时刻。全球范围内,完整参与了三个关键节点的科技公司寥寥无几。

在中国,它是一个意料之外又情理之中的名字:百度

广招天下英雄

辛顿早年在多伦多大学任教,曾多次请求学校聘任另一位教授跟自己一起工作,被校方无一例外拒绝,理由是[1]:“一个疯狂的人做这件事就够了”。

这代表了2012年之前学术界对深度学习的主流态度——说好听点是百家争鸣,说难听点是死路一条。神经网络的名称和结构都取材自人脑的运作方式,由于模拟了人脑的机制,人能做的事情神经网络都能做,因此,深度学习是一种在理论上非常完美的方案。

然而,无论是它需要吞噬的数据,还是需要消耗的算力,在当时都是一个科幻级别的规模。举例来说,谷歌的实验性项目“谷歌猫”用16000个CPU构建了一个10亿节点的巨大系统,然而,人脑约有1000亿个神经元,神经元之间的节点(突触)更是多达万亿。

有了这个背景,就不难理解辛顿教授手持两块GTX580显卡横扫ImageNet大赛,给产业界带来的震撼了。

但兴致勃勃的科技公司马上遇到了一个崭新的问题:深度学习是一个非常小的学术圈,顶级学者更是两只手数得过来,继而造就了那场著名的拍卖:微软、百度、谷歌和DeepMind从1500万美元喊到了4400万美元,最终辛顿叫停了拍卖,把自己的“皮包公司”卖给了谷歌。

一场人才争夺战就此拉开,谷歌毫不犹豫的买下了陪标的DeepMind。漫不经心的微软阴差阳错的在2019年投资了OpenAI,收获了最大的战利品。百度亲身经历了美国科技公司对人工智能的义无反顾,在2013年成立了百度深度学习研究院,《智能革命》中说,这是“全球企业界第一家用深度学习来命名的研究院”。

一年后,百度请来了深度学习泰斗级人物吴恩达。后者作为顾问和“谷歌大脑”的传奇人物杰夫·迪恩一起带队完成了“谷歌猫”项目——让算法自己观察和学习猫的特征,识别图片里的猫。

吴恩达在谷歌设计了“谷歌猫”项目

如果没有ImageNet大赛上大放异彩的AlexNet,改变历史的很可能是谷歌。吴恩达加入百度的原因也很简单[3]:当时谷歌对GPU训练算法态度不明,不支持他购买更多昂贵的GPU,但百度表示“随便买”。

这场人才争夺战对大公司的挑战性在于,他们要容忍并接受一群最聪明的头脑做着流程无法量化、ROI无法计算的工作。这是很多中国公司第一次亲身感受“长期主义”的内涵和属性,也是在移动互联网百花齐放的年代,百度的一段不太为人知的历史。

吴恩达加入百度时,百度在内部发了一封内部信表示欢迎,吴恩达在回信中说:多样性带来伟大的创造力,那些从北京到硅谷的好想法将会使我们更快创新,作出更令人惊讶的创新。

两封看似礼节性的内部信带来了远超百度预期的效果,六位人工智能学者通过邮件表达了加入百度的意向——硅谷的科学家可能并不了解百度,但都熟悉吴恩达。后来,百度又请来了Dario Amodei,他是日后Anthropic的联合创始人及首席执行官,Anthropic是OpenAI最主要的竞争对手。

Dario Amodei(左)

ImageNet大赛同年,百度开始大规模采购和建立GPU运算集群,开发了世界上第一个支持GPU&CPU的并行深度学习平台PaddlePaddle(飞桨),意在聚拢更多的开发者,做大深度学习的“朋友圈”。

正是由于深度学习长期不被看好,这个领域的研究者是个很小的圈子,然而产业化空间的迅速打开让科技公司直观的感受到了人才的重要性。用一个不太恰当的说法,万物竞发的年代,聪明的头脑是这个产业的“基础设施”,他们决定了产业界在日后能够碰触的上限。

而在许多科技公司真正意识到AI的革命性之前,百度给中国带来了最宝贵的资产:人才,以及让他们成长的土壤。

创造产业和生态

今年百度世界大会期间,李彦宏在接受采访时曾谈及百度对人才的看法[3]:好多公司的创始人是百度出去的,有不少互联网公司的CTO是百度出去的,其实我很高兴,这意味着我们既给社会做了贡献,又树立了百度的技术品牌。

许多深度学习的先驱人物或多或少都与百度有关,他们有的人留在了百度,有的人离开了百度。人们会习惯性的将人才的去留与公司的成就挂钩,但这种看法实际上有些片面。

法国公司Mistral是欧洲AI产业炙手可热的明星。但问题是,这家公司的三个创始人都曾在美国科技公司工作,大部分Mistral员工的上一份工作,也在美国科技公司位于欧洲的分支机构。Mistral成立八个月内的两次融资中,背后的核心力量也是美国的风投基金和产业资本。

尽管CEO Arthur曾多次公开表示Mistral的主要目标市场是欧洲,并强调欧洲在人工智能领域的独特优势。但同样身不由己的是,Mistral目前一半的客户都来自美国市场。换句话说,它是个伪装成法国公司的美国公司。

Mistral的轨迹似乎重复着某种轮回。凭借AlphaGo红极一时的DeepMind诞生在英国,但在创办第四年就被谷歌收入囊中。Stable Diffusion背后的Stability AI同样是家英国公司,但似乎所有人都默认它是美国公司。

高等教育可以培养人才,但吸引人才靠的是产业的繁荣。

全世界的高校都有计算机科学专业,但顶尖的人才最终会流向产业的所在地。欧洲和印度贡献了大量人才,但缺少留住他们的软件和互联网产业,这恰恰是中美的优势。

从2013年成立自动驾驶研发团队开始,百度投入了对人工智能产业化的探索。一方面,百度以自动驾驶为锚,在这个最清晰明确的落地场景中不断开花结果。同一年,百度深度学习研究院开始研发深度学习框架“飞桨”——所谓框架,可以理解为一个集成了主流算法模型和模型训练工具的工厂,承接各种模型和行业应用,类似人工智能的操作系统。

2016年谷歌前CEO施密特率队捧场AlphaGo大战柯洁,一个重要任务是在中国推广谷歌的深度学习框架TensorFlow,但反而意识到了飞桨的影响力被自己低估了。同一年,美国《财富》杂志把百度与谷歌、微软和Facebook并列称为全球四大AI巨头,认为其代表了人工智能全球范围内最顶尖的水平。

百度的自动驾驶探索则在一年后迎来阶段性成果,2017年百度Apollo推出了全球首个自动驾驶开放平台,李彦宏在全程直播的画面中,坐在一辆自动驾驶汽车前往会场的景象,又给发布增添了一抹戏剧性色彩。

2017年,李彦宏乘坐无人驾驶汽车进入会场

此后几年内,百度的无人车相继落地上海、武汉、重庆等多个城市,曾经遥不可及的Robotaxi也逐渐照进现实,“萝卜快跑” 一步步成为国内服务范围最广的Robotaxi。

2016年,飞桨正式开源,为百度的多元化 AI 业务提供了统一的技术支持。无论是自动驾驶、智能语音等业务,都可以基于飞桨进行开发和优化,也使得百度能够快速推出新的 AI 产品和服务。2019年3月,百度就发布了文心大模型1.0版本,持续迭代至今。

2019年的WAVE SUMMIT峰会上,百度CTO王海峰博士曾准确预言了人工智能在未来的走向:“深度学习框架是智能时代的操作系统。深度学习的通用性特点,以及深度学习框架及平台的发展,正在推动人工智能标准化、自动化和模块化,进入工业大生产阶段。”

时至今日,百度已经形成了最完整的AI产业布局,包括芯片、智能云、大模型、自动驾驶等各个领域。全球范围内,只有谷歌、特斯拉等极少数公司完成了这种布局。

萝卜快跑第六代无人车亮相街头

这些布局最大的价值在于,它为人才提供了一个“蓄水池”,顶尖的人才可以在具体的产业中成长,产业的进步又会聚拢新的人才,他们都留在了中国。这就是生态的含义和意义。

2023年9月7日,《时代》周刊发布了首届全球百大人工智能人物。作为该榜单中唯一入选的中国互联网企业家,李彦宏和马斯克、黄仁勋、山姆·奥特曼等企业家共同被评为全球人工智能领袖。《时代》周刊的评语是:

“李彦宏是中国最杰出的未来主义者,长期投身于人工智能发展的浪潮(As China’s foremost futurist, Robin Li has been riding the AI wave for a long time)。”

从2013年深度学习研究院成立算起,百度在人工智能的投入已经整整十年,但新的故事也才刚刚开始。

百度的命运

今年的百度世界大会,李彦宏演讲主题是“应用来了”,100多个AI原生应用集体亮相。李彦宏指出,过去18个月到20个月的时间里,大模型领域最显著的变化,是回答问题的准确性,大模型的幻觉正在消失。

截至11月初,百度文心大模型的日均调用量超过15亿次,对比一年前这个数据首次披露时的5000万次,增长了近30倍。百度智能云千帆平台,已经帮助客户精调3.3万个大模型,开发了超过77万个应用。

而伴随无代码工具秒哒的推出,一个应用爆发的图景逐渐展开,如李彦宏所说:百度不是要推出一个“超级应用”,而是要不断地帮助更多人、更多企业打造出数百万“超级有用”的应用。

2024年百度世界大会

时至今日,人工智能产业语境下的“人才”早已不再是埋头坚持的少数学者,但他们的重要性依然举足轻重。

一个稍微反直觉的事实是,越是繁荣的产业,人才的流动性越大,因为它代表着这个产业有多少机会和增长。对于一家企业来说,它对人才的吸引力并不体现在有多少人留了下来,而是它被多少人所向往,有多少人因为它不断的成长。

李彦宏把自己的人工智能的思考都放在了2017年出版的《智能革命》一书中,他在里面也谈及了百度与人才的关系:百度是中国人工智能产业的代表,大量顶级人才先后投身百度。同时,也有很多人才从百度出发,创造了自己的人工智能应用公司。百度本身就是中国在吸引和培养人工智能人才方面活力的缩影。

七年后接受采访,李彦宏依然表达着类似的观点[3]:我觉得更年轻一辈的,现在还没有出名的那些人,是真正我们最宝贵的财富。

技术理论的突破,人才的聚集,产业界的繁荣勾勒了大部分技术革命的底色,这也是百度在人工智能进步中扮演的角色。今天,百度开始系统性思考,在应用爆发的前夕,自己应该扮演什么样的角色。

按照李彦宏的设想,AI智能体将成为内容、服务和信息的新载体,比网站的想象空间更大。在百度世界大会现场的案例中,比亚迪官方智能体让销售线索转化率提升了119%。

2024年百度世界大会

和促使百度投身深度学习的那场人才争夺战一样,今天人工智能的落地同样缺少足够清晰的时间指引和足够量化的评判指标,对百度来说,它依然是某种长期主义的延伸。

支撑这种宏大愿景的不是以季度为周期的考核,而是以五年十年为单位的长远规划。风险投资家彼得蒂尔说20世纪初的美国人愿意尝试新事物,敢于规划几十年周期的登月计划并去实现。《马斯克传》中说:真刀真枪的实干家越来越少,动动嘴皮子吹哨的裁判员却越来越多。这就是为什么美国再也造不出高铁和能够登月的火箭。

作为一家公司,百度用十年如一日的技术投入参与了人工智能在中国发展的全过程,在很多个落地场景中,都有百度的身影。

而它扮演的更重要的角色是,在深度学习万马齐喑的时期,它给无数人才提供了一个容身之所,为中国的人工智能产业铺设了一条发展的道路。

时至今日,百度依然在路上。

尾声

2021年百度香港上市,李彦宏发布了一封5000多字的股东信。信中表达的更多是李彦宏作为一个技术出身的科技公司掌舵者,在人工智能发展路径逐渐清晰时,对躬身入局的执著和渴望[4]:

我们培养技术人才,我们输出技术文化,让更多企业看到技术的价值并重视对技术的投入,搭建起中国互联网的技术骨架,这是一件意义非凡的事情。

李彦宏还在股东信里谈到了“百度”这个名字——“百度”之前不是一个词,没有任何既有的含义,这意味着它的所有寓意都由百度自己来书写。从2012年开始,百度用一种独特的冒险精神来定义它。

在无法预知终点的长跑中,可量化的目标没有意义。很多看似横空出世的创新,也许都经由反复的探索,逐渐描摹出来。

人工智能是一篇未完待续的技术史,也是百度的命运。

全文完,感谢您的耐心阅读。

参考资料

[1] 深度学习革命,凯德·梅茨

[2] 智能革命,李彦宏

[3] 对话李彦宏:应用驱动是百度的第一性原理,基础模型两年一个大版本就够了,甲子光年

[4] 致股东信,李彦宏

作者:李墨天

编辑:戴老板

视觉设计:疏睿

责任编辑:李墨天

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论