OpenAI于昨天发布了最新的o1大模型,这不但是自从GPT-4发布以来基座大模型的一次最大更新,也是生成式AI发展史上的一个里程碑(甚至转折点):直到GPT-4o为止,所有的大模型都致力于解决“即时性任务”,在接到任务之后总是“不假思索”地立即进行答复。而o1的定位则是解决复杂问题,它会把一个问题进行拆分,对每个部分反复推理(这个过程称为“思维链”),以较慢的速度达到较佳的结果。因此,与迄今为止的所有主流大模型相比,o1更适合解决复杂的逻辑推理问题。例如,o1解答国际奥数题目的准确率高达83%,而GPT-4仅有13%。
由此扫平了通向“智能体”(AI Agent)时代的最大障碍。迄今为止,生成式AI最擅长也最主流的应用是聊天机器人(Chatbot),但我们知道,现实中绝大部分的任务不能通过聊天解决。等到o1这样擅长复杂逻辑推理的大模型流行起来,我们使用生成式AI的方式会发生天翻地覆地变化——不再是向AI提出一个又一个的问题并期待立即回答,而是每天(或者每隔一段时间)交代一组复杂的任务,期待AI经过深思熟虑(以及充分收集外部信息)之后给出阶段性的回答。AI的工作方式会与人类越来越像,越来越有用。而这就意味着人类社会的专业白领阶层将受到前所未有的冲击!
我们不妨回忆一下,自己的学生时代,最盼望从事什么职业、加入什么行业?毕业后实际从事的又是什么职业?答案一定很多,千头万绪,但是万变不离其宗,其中大部分应该都属于所谓“专业白领岗位”。十多年前我读书的时候,互联网行业尚不流行,商学院的学生最想去的第一是金融业,第二是咨询业,第三是大型外企或国企的“管理培训生”岗位。去四大会计师事务所做审计或税务咨询也是一条通行的道路,因为“四大”招人较多且解决户口。
上面提到的职业有什么共同点?它们都属于“专业服务业”,或者综合性企业内部的专业服务岗位。所谓“专业服务”(Professional Service)的范围可大可小,广义上可以连企业软件乃至消费互联网行业都包含进去。这些行业具备如下共同点:
既不属于第一产业(农业、采掘业),也不属于第二产业(制造业),只可能属于第三产业(服务业)。
所谓“专业”,既包括服务本身的专业性,又包括从业者的专业性:拥有大学学历是基本门槛,大部分从业者拥有研究生学历或同等级别的专业认证。
专业服务机构是“高智力人力密集型”组织,最大的财富是其员工的智力。资本、设备等也很重要,但最重要的还是人。
提供的服务价格比较贵,客单价比较高。在扣除所有非人力成本以及公司利润之后,仍能给员工发上一笔不菲的工资。
在发达国家,专业服务业的象征是医生和律师,哪怕没有接受过高等教育的人也知道它们是受人尊敬、收入丰厚的职业。电影《黑社会2:以和为贵》当中,男主角身为香港著名黑帮的老大,当外人建议他把黑帮老大的职位传给子孙时,他却深受刺激,嘴里念念有词:“不,我的儿子是医生,我的儿子是律师……”其实,香港也好,美国、西欧也好,只要是深受西方文化影响的地区,谁不想让自己的儿子成为医生或律师?除此之外,去华尔街做金融,同样是高收入且受人尊敬的职业,不过他们的工作与一般人距离太远,从非专业的角度不太好理解,远不如医生和律师那样直观、贴近人群。
专业服务机构的门槛是什么?个人从事这一行所需的资源禀赋又是什么?这两个问题其实是同一个问题的两面。大部分专业服务行业存在牌照限制,例如律师事务所要持牌,律师个人也要持牌;医生、会计师、金融从业者就更不用说了。牌照制度一方面是为了法律合规,方便监管和事后追责;另一方面则是为了确保从业者具备基本的胜任能力。在发达国家,除了医疗之外的大部分专业服务业,牌照管理其实不太严格,行业竞争主要还是遵循市场化机制,持牌只是一个基本底线而已。
除了牌照和一定程度的资本之外,最重要的门槛就是所谓“专业知识”了。专业知识不等于创造力,甚至可以与创造力完全无关。《肖申克的救赎》有一个经典场景:肖申克监狱的狱警在屋顶平台上埋怨缴税负担太重,男主角安迪马上想到了合法降税方案,以此赢得了狱警的感激和几箱冰啤酒。安迪入狱之前是银行家,不是税收顾问,但同样很熟悉税法。问题在于,他是依靠“创造力”给狱警解决问题的吗?不如说是依靠记忆力以及经验。一言以蔽之:“行活儿”。反观可怜的狱警,之前根本不知道合法降税这个概念!
按照韩愈《师说》的观点:“闻道有先后,术业有专攻。”在专业服务业,知识的价值首先是形成信息差,我知道、你不知道;其次是形成熟练度,做的次数多了就知道下一次该怎么做,形成所谓“条件反射”。做的时间久了,从业者会慢慢发现,知识其实并非最重要的门槛,在漫长从业过程中形成的人脉关系和个人品牌才是。归根结底,任何服务业都是在跟人打交道,路边咖啡馆里端盘子的侍应生是如此,写字楼高层办公室里发号施令的大律师也是如此。但是,只有金字塔顶端的人才有资格、有条件建立错综复杂的关系网,金字塔中基层的广大打工人仍然是依靠着所谓“知识”养家糊口。
毫无疑问,AIGC的普及将对整个专业服务业,尤其是其中的中基层打工人构成严重冲击。其实早在当代深度学习技术诞生之前,IBM就试图以Watson AI解决方案替代一部分医生。由于美英等发达国家的医生一直短缺、医疗系统不胜重负,大部分医生其实是欢迎这种替代的,只是IBM未能做到而已。现在,经过一定程度的调教,ChatGPT完全可以向用户提供初级的财务、税务、法律乃至医学方面的建议,唯一的缺点是它无法为自己的建议负责。等到AI相关的法律体系更加完善了,二次开发的垂类应用更加普及了,AIGC真的有可能让很多人丢掉饭碗。
在十多年的金融机构从业经历中,我亲眼目睹了信息科技是如何冲击这个古老而傲慢的行业的。整个金融业利润最丰厚、从业人员待遇最高的是资本市场相关业务(经常被外界统称为“投行”,尽管投资银行只是其中很小的一块),包括投资银行、销售交易、研究、资产管理和财富管理,等等。从20世纪后期到21世纪初,它们逐一感受到了信息科技带来的压力:
证券交易的电子化开始于1970年代,总体上越来越趋向于计算机程序驱动的自动化交易。现在,实地证券交易几乎已经绝迹,需要人工干预的电子交易占比也越来越少。资本市场的交易额在猛烈增长,金融机构收取的佣金率和价差却越来越低。
证券研究在2000年代以前是一项利润丰厚的业务,但随着监管收紧以及互联网带来的信息透明化,现在研究业务已经基本只赚吆喝不赚钱了。无论在时效性信息还是深度方面,金融机构的影响力都已经落后于互联网化的财经媒体。
狭义的投资银行,即证券发行和并购业务,总体上还是利润丰厚,但也大不如前。投资者对公司的估值方法日趋多元化,金融机构的“定价权”已经聊胜于无——2004年8月,谷歌的IPO第一次采用了“在线拍卖”的定价机制。金融机构从投行交易中收取的佣金比例也越来越低。
资产管理和财富管理,即“买方”业务,是近年来金融机构竞相追逐的业务,因为它们能带来稳定的收入流。但是,买方业务也被互联网深刻改造了,欧美所谓的“金融科技”公司,有很大一部分就是与信息科技深度融合的资产管理和财富管理公司。
在AIGC普及之前,金融机构早已在科技的冲击下力不从心;AIGC的普及则可能是压死骆驼的最后一根稻草。以当前国内发展很快的财富管理,包括私人银行、信托和家族办公室等业务来说,客户最需要的第一是理财知识和建议,第二是获得高效的投资工具。AIGC能够比较高效地满足第一个需求。对于那些资产规模不太大的“入门级”客户来说,基于AI大模型微调后的聊天机器人足够满足需求了。要知道,金融业已经是传统上人们认为技术含量最高的专业服务业之一了,如果金融业都被冲击成这个样子,其他专业服务业又会如何?
不要误会,金融业不会消失,会计、税务、法律、医疗服务行业也不会。只要需求存在,供给就必须被创造出来,区别是“由谁来创造”——人类,还是AI?在历史上,无数的行业都出现过人类被自己创造的机器替代的情况。我们至今仍在使用的电话系统,诞生之初曾是典型的劳动密集型行业。数十位乃至数百位接线员,坐在一排排电话交换机前方,一边用耳机收听用户的请求,一边通过插线拔线来实现其请求。这种画面直到第二次世界大战结束时还存在!另一个典型案例是电梯操作员,早年的电梯是需要人工操作的;随着自动化程度的提升,操作员的主要职责变成了维护秩序和安全,然后逐渐消失。
电话接线员和电梯操作员在诞生之初,算得上不折不扣的“专业服务岗位”,前者还是坐办公室的“白领”。因为早年的电话交换机和电梯都是十分精密的电气设备,而且由于设备价格昂贵,没有企业敢把它们交到自己信不过的员工手里。进入20世纪以后,从事电话接线员职业的大部分是女性,甚至在一定程度上促进了妇女解放。最终导致它消失的是信息科技——“程控电话交换机”不再需要接线员,所谓“程控”,就是“计算机程序控制”的意思。电梯操作员的命运与其相仿,现在的电梯在本质上都是“程控电梯”。
我们可以说:自动化交易程序替代了一大部分证券交易员;网上银行和手机银行替代了许多银行柜员;内容推荐算法替代了许多专业内容编辑;财务软件替代了相当一部分财务工作者。不过,“替代”这个说法太片面了,因为传统的计算机程序还是需要人来操作,而且对自然语言的理解能力普遍比较有限。所以,它们对专业白领的辅助作用要大于替代作用。像电话接线员那样容易被彻底替代的岗位,早在20世纪中期就被替代掉了;幸存到计算机时代的白领岗位,都是没那么容易被彻底替代的。
然而,AI大模型跟以前所有的计算机程序都不一样:它能理解自然语言,能执行“生成”任务,能搜罗并利用大量人类知识;随着时间推移,它还具备了多模态能力和长文本理解能力。它固然也可以给专业白领“打辅助”,但是自身完全具备“打C位”的能力,甚至可以既打C位、又打辅助。就连信息科技行业自身都感受到了AIGC的压力,昔日屡次震动其他传统行业的计算机程序员们,现在自己也面临着来自AIGC的大地震。
在ChatGPT诞生后的头两年,我们还可以强词夺理地说:“大模型只能用于聊天,解决简单的即时性任务,没法独立执行复杂的任务!”可是o1大模型的发布,彻底动摇了人们的上述信念。当然,现在的o1还不够好,有些人发现它甚至在简单的算术题上面也会出错。但只要这条道路正确,再过三年、五年乃至十年,生成式AI可能真能执行绝大多数专业白领的工作。届时专业服务机构的“晨会”,出席者恐怕不再是人类,或者仅有寥寥几个人类;占据绝对多数的是“智能体”(不论它们有没有物理形态)。
那将意味着什么?大规模失业,又一批专业从朝阳沦为夕阳?整个社会需要的劳动人口大幅下降?或者人类干脆不需要再工作了?这些可能性固然不容忽视,我们将在下一节展开讨论。不过我们总得考虑一些其他可能性:西方谚语云“上帝给你关上一道门,必然会为你打开一扇窗”,AIGC导致的白领结构性失业,会不会只是又一次产业革命的导火索?
如果一定要寻找一个吸纳就业的新兴行业,或者说“对打工人比较安全的行业”,我首先想到的就是那些激励人、感动人、与人分享喜怒哀乐的行业。我们是人类,人类是一种同时具备复杂智慧和感情的哺乳动物,更喜欢与同类交流。2024年4月,山姆·奥特曼在斯坦福大学的演讲中提到:人类始终更喜欢人类,哪怕现在AI下棋水平已经全面超过人类了,人类还是更喜欢看人类下棋。他提到了一些反例,比如青少年更喜欢跟AI而不是心理医生讨论自己的心理问题;这倒是可以理解的,毕竟心理问题涉及太多的个人隐私,人们不太乐意向外人敞开心扉。
记得多年以前,“虚拟偶像”(Vtuber)技术诞生之时,一些投资者十分兴奋,认为将彻底改变演艺圈乃至整个泛娱乐产业的格局。因为娱乐行业高度依赖明星,许多影视公司本质上是在给明星打工;直播行业也是如此,大主播日进斗金、颐指气使,可以凌驾于公会乃至平台之上。若能用虚拟偶像替代人类,无疑将彻底改变泛娱乐产业的利益分配格局,对资本方非常有利!
结果如何呢?时至今日,虚拟偶像确实取得了很大发展,在部分内容平台拥有了自己的专区,一些头部虚拟偶像也确实日进斗金——可是离替代人类还差得远。在秀场直播、游戏直播和电商直播这三大直播赛道上,最赚钱和最有影响力的主播仍然是人类。在演艺圈就更是如此了,以初音未来、洛天依为代表的“虚拟歌姬”没有造成任何变革,只是一阵风;那些成功的虚拟偶像的粉丝总是热衷于寻找“中之人”,即虚拟主播的扮演者。他们貌似喜欢上了一个科技制造的数字化形象,真正喜欢的却是数字之下的人类心灵。假如虚拟偶像背后的资本竟敢撤换“中之人”,就要冒着粉丝大规模流失的风险。
人类的独特性或曰不可替代性,到底体现在哪里?莎士比亚在《哈姆雷特》当中如此赞颂人类:“人类是多么了不起的杰作!多么高贵理性的!多么伟大的力量!多么优美的仪表,多么文雅的举动!在行为上多么像一个天使,在智慧上多么像一个天神!宇宙的精华,万物的灵长!”那是16世纪,地理大发现还在进行,工业革命尚未发生,人类尚未释放出改天换地的巨大科技力量。此后几百年,人类在文化和科技领域均取得了巨大的成果,也制造了惨烈的灾难;关于“人类作为一个整体是否可以替代”的讨论,早在第二次工业革命期间就被提了出来,经历两次世界大战而愈演愈烈。人类亲手创造的文明世界,是否终将导致人类自身被淘汰出局?这个问题既是功利层面的,也是哲学层面的。我们知道,在自然界的进化过程中,任何物种皆非不朽。
AI是不是人类亲手创造出来的自身的替代者?不是替代某个人、某一群人,而是替代绝大多数人,甚至所有人?对这个问题,我想援引威廉·福克纳(William Falkner)接受1950年诺贝尔文学奖时的演讲,这是我最喜欢的演讲之一:
“我拒绝接受人类有结局。你可以轻易地说,人类是不朽的,仅仅因为他可以存在下去:在世界末日的血色黄昏,最后的钟声逐渐从浪潮汹涌的小小礁石上空褪去,即便在那种情况下,人类渺小而永无休止的声音还是会一直诉说下去。我拒绝接受这种前景。我认为人类不仅会存在下去,还会胜利。他是不朽的,不是因为万物之中只有他具备永恒的发言权,而是因为他有灵魂,具备同情心、牺牲和忍耐力的精神。诗人、作家的任务就是去写这些东西。他们的权力就是振奋人心,让人类回想起在过去的岁月里,勇气、荣誉、希望、自豪、同情心、怜悯和牺牲曾经给他带来何等光荣,由此帮助人类存活下去。诗人的声音不应该仅仅是人类的记录,而应该是帮助人类存在和获胜的支柱、栋梁。”
福克纳在世时,信息科技革命尚在初始阶段,AIGC更是还没有影子。当时对于人类未来的怀疑,主要是出于对核武器和下一次世界大战的恐惧。倘若福克纳今天还活着,AIGC浪潮应该也不会改变他对人类命运的看法。人类有灵魂,有勇气、荣誉、希望、自豪、同情心、怜悯和牺牲精神,这些精神不仅帮助人类存活,也是人类的光荣所在。人类之中有败类,不是所有人都具备上述精神,但是作为一个整体的人类是不朽的。
我想,这就是人类更喜欢与人类打交道的根本原因。与自己的同类相处时,我们知道对方有感情有思想,饿了想吃饭,困了想睡觉,渴望被爱,被伤害了会疼,有亲戚和朋友。每当我们对对方施加感情,无论是正面还是负面的,对方会反馈感情。在这个寒冷空虚的宇宙中,主要由岩石和岩浆构成的星球上,我们彼此取暖、互相倾诉和理解,建立了一个小小的温暖之家。我们基于硅片和金属导线创造出来的东西很伟大,但它们依旧是寒冷的。它们表面上具备的那点温度来自对人类的模仿,而且是人类手把手教会的。
可是人类不知道自己为什么去爱,为什么有荣誉感,为什么富于同情心,为什么为他人牺牲自己。作为个体的人类,经常做一些完全无利可图的傻事:“我偏要勉强”,“虽千万人吾往矣”,“在真理面前我半步也不会退让”。人类其实一直就不喜欢自己所生存的世界,有些人选择逃避它,选择改造它,还有些人选择超越它。改造和超越的难度都远远高于逃避,人类为什么要做出如此吃力不讨好的选择呢?这究竟是生物的本能,是人类在漫长岁月中形成的潜意识,还是像福克纳描述的那样——人类真有灵魂?
人类可以把复杂的逻辑推理能力教给o1大模型,因为人类知道自己是怎么做逻辑推理的,这种事情比较容易教。可是,如果一个老师不知道自己的技巧究竟是怎么回事,他如何把这种技巧教给学生?AI就是那个学生,理解感情就是那个没法教的技巧。
在经典科幻电影《终结者2》当中,施瓦辛格扮演的“终结者”是一具安装了神经网络CPU的人型机器人。当时的编剧敏锐地注意到了神经网络的未来,但他们不可能预料到现代神经网络的算力基础是GPU而不是CPU。终结者为了拯救年幼的约翰·康纳而来,他擅长战斗,但是无法理解人类的感情。当约翰流泪时,他会问:“你的眼睛怎么了?”在影片的结尾,为了切断敌人的追踪线索,终结者决定自我牺牲,将自己沉入高温钢水之中。约翰再次流泪了,这一次终结者终于明白了。他一边擦去约翰的泪水,一边说:“我现在知道你为什么流泪了,但这是我永远做不到的事情。”
AI有一天能学会流泪吗?即便有那么一天,离我们也非常遥远。在那之前,我们应该珍视自己身为人类的一切优点或弱点。围绕人类的感情、交流和表达欲,将成长起更多的新业态,旧有业态亦有机会焕发新的活力。专业白领阶层的衰落或许是不可避免的,但是只要我们意识到身为人类的特殊性,总归能在所谓“AI霸权”之下找到新的出路。严肃的问题是:即便找到了新的出路,也不一定意味着一切问题迎刃而解,因为人类社会的不平等可能被进一步强化。
世界是不公平的,要学会适应它。适应一切、改造一切,正是人类作为万物之灵的荣耀。面对生成式AI的浪潮,我们也只能如此。
精彩评论