苹果就是人工智能荡妇!这是我在Reddit上看到的一句话。话有点糙,不过用来形容苹果当下在人工智能上的策略,倒也蛮形象。
继在6月12日WWDC大会上宣布和OpenAI合作之后,又传出苹果正和谷歌洽谈,并预计在秋季将Gemini整合进iOS。与此同时,还有消息说,苹果还在跟Meta讨论合作事宜。
接下来是不是轮到Anthropic了?毕竟它在6月21日发布的Claude 3.5 Sonnet收获了很高的市场评价,不仅性能不输GPT-4,还比三个月前推出的Claude 3 opus 速度快 2 倍,成本低 80%。
有人开玩笑,坐等马斯克推特发飙,因为除了Grok,大模型似乎都在苹果的考虑范围之内。
苹果为何如此花心,见大模型都想上?不妨听听我的分析。
苹果和OpenAI的合作主要基于Siri。当OpenAI 5月发布GPT-4o时,我就觉得它是为Siri量身订做的,因为所有的演示都是通过语音来调用大模型,包括发送图片、查天气情况、实时翻译等,非常贴合Siri的使用场景。自从chatGPT问世以来,大家对Siri的弱智再也无法忍受了,要求苹果对它进行AI升级的呼声越来越高,而GPT-4o的表现简直就是我们理想中的Siri。
不过令人意外的是,一个月后苹果在WWDC上隆重介绍了新siri,而对OpenAI的合作只是轻描淡写一笔带过。根据演示,新siri发图片等AI功能应该来自苹果自身的端侧大模型,chatGPT是当用户处理复杂任务时,苹果才推荐使用。此外,数据留在苹果的私有云上,OpenAI拿不到。
有消息说,苹果和OpenAI的合作互不付费,但如果有用户订阅chatGPT,苹果能获得类似应用商店一样的分成比例。
通过这样的平等合作,苹果完成了万众期待的siri升级,同时又保留了自己在AI上的主导权。
跟谷歌合作和跟OpenAI合作的消息是同步传出来的,为什么OpenAI已经落地,而谷歌还悬着?我认为,这牵涉到苹果一直以来跟谷歌搜索的合作,谈判更加复杂。众所周知,过去十多年来,谷歌搜索都是苹果各设备的默认搜索引擎,谷歌为此每年向苹果支付巨额费用,为此还摊上了美国政府的反垄断诉讼。
关于谷歌给苹果支付的费用究竟是多少,说法不一,有说一年几十亿美元,有说是上百亿美元。根据彭博社今年5月的报道,在美国司法部关于谷歌反垄断诉讼的庭审文件显示,2022年谷歌向苹果支付了220亿美元,以成为safari浏览器的默认搜索引擎。这220亿美元究竟是一年还是十年的费用,我们无从得知。
事实上,自从微软宣布将chatGPT接入Bing以来,谷歌也不敢懈怠,紧锣密鼓地用生成式AI改造搜索。虽然经历了一些波折,到今年5月14日的I/O大会上,谷歌搜索已经旧貌换新颜:
一是AI overviews让谷歌搜索具有了推理、记忆、规划的功能。具体来说,以前搜索是一次只能问一个问题,但现在你可以一次问清,并得到一个整体的结果。比如你要去某地度假,以前订酒店、餐厅和景点要分三次,但现在你可以一次性搜索,得到一个直接的综合性的结果。
二是视频搜索拓宽了谷歌搜索的疆界。谷歌员工在I/O大会上演示了视频搜索的用例:她买了一个二手唱片机,但用不了,她既不知道这是什么品牌、什么型号,也说不出不能动的部件叫什么。她拍了个视频给google,google识别出了唱机的品牌、型号和问题,并提供了修理方案。
这两个功能都令人激动,对于25岁的谷歌搜索来说,毫无疑问是一次革命性的升级。这会令谷歌和苹果十多年的搜索合作也发生变化吗?我相信肯定会,尤其当下谷歌因此面临美国政府的反垄断诉讼,两家公司说不好会重新谈判。
对于苹果来说,跟谷歌的合作是停留在safari的默认搜索上,还是结束默认搜索改为其它方式的合作,抑或有没有可能扩大合作的范围,我认为这些都是双方要认真考量的问题。也正因为两家合作之复杂性和诸多可能性,所以谈判至今没有结果。弄不好,哪天宣布一个让大家惊掉下巴的合作方案,也不是不可能。
最后我想谈谈苹果和Meta合作的可能性。Meta受外界关注的就是开源大模型Llama,但其实它还在生成式AI上的投入可远不止这么点。
去年以来,Meta隔三叉五地就发布一篇AI相关的论文和技术,包括分割图像的SAM大模型,视觉大模型DINOv2,音乐生成模型 MusicGen,跨图像、文本、深度、热度图、音频和IMU(运动数据)六种模态的缩合模型ImageBind,能准确分析和完成图像中缺失部分的类人模型I-JEPA等等(参考科技资本论去年6月的文章《AI布局最超前的,竟然是Meta》)。
最新消息是,7月3日Meta发布了文生3D模型Meta 3D Gen,能在1分钟内根据文本提示词快速生成3D资产(指制作3D动画的数字化资源,如3D模型、纹理贴图、材质等),而且还支持基于物理世界的渲染。
制作3D资产耗时又费钱,一直是游戏开发、电影特效及VR/AR应用的痛点。Meta的Quest是目前全球销量最大的VR头显,但努力了小十年,应用生态一直小打小闹,不成气候。
根据VR陀螺的统计,今年Meta将Quest Store升级为Horizon Store,应用数量超过2900款。跟动辄几百万款的手机应用相比,简直相形见绌。3D Gen有助于降低3D应用的开发门槛,加快Quest应用数量的增长。
3DGen模型也是苹果vision pro急需的。被库克定义为开创空间计算时代的vision pro上市半年来,遭到各种诟病,加上价格昂贵,估计销量大不到哪去。当然vision pro目前还在培育市场的阶段,而重中之重就是先建设应用生态。
在WWDC大会上,库克透露vision pro兼容应用(iPhone\iPad\Mac book搬过去的应用)有150万,原生应用2000多款。显然,区区2000款应用完全配不上vision pro高达3500美元的售价。我想这就是苹果为什么要找Meta 谈AI合作的原因,尽管在很多人眼中,Facebook因2018年的剑桥分析事件在数据隐私方面已经臭名昭著。但3DGen能降低vision pro应用的开发门槛,让应用生态发展得更快一点。
你肯定要问,vision pro是Quest的竞品,Meta为什么要帮苹果?因为苹果拥有庞大的、成熟的开发者群体,根据苹果2022年公布的数据,全球的苹果开发者数量超过3400万。苹果一呼、应者云集,这是Meta在开发者群体中所缺乏的影响力。
而且Quest从定价上偏中低端,和vision pro不存在正面冲突。Quest和vision pro,就有点像安卓机和iPhone,一个走中低端路线、一个走高端路线。目前XR市场处在早期阶段,还需要培育,两家先联手一起把应用生态做起来,对双方都有好处。
毕竟有更多的内容应用,才可能卖出更多的硬件。而Quest业务也才有可能尽快走出亏损的泥沼,从2020年至今年一季度,它所在的Meta现实实验室业务已经亏损了504.76亿美元。
OpenAI、谷歌、Meta,在苹果的人工智能战略中各有不同的价值和位置,而坐拥全球20多亿手机用户的苹果,有足够的筹码和它们周旋、博弈。
苹果在WWDC上承诺的那些AI功能不知道何时才能落地,但股价已经大涨了一波,从4月份的低点163美元涨到了现在的226美元,两个月时间涨幅近39%。
不管最后谷歌和Meta怎么上,反正苹果都不吃亏。
继微软、苹果之后 又一个操作系统级的AI生态来了
蔚来,困在高端里
百度很矛盾
马斯克配得天价薪酬吗?
精彩评论