轮到字节追赶快手一次了

在快手“可灵”与文生视频领域的迅猛崛起之下,同场竞技的字节跳动无疑感受到了前所未有的压力与挑战,这份突如其来的市场热度,不禁为其平添了几分尴尬与紧迫感。回溯今年字节的“激进”布局,其大模型战略的蓝图之宏伟、架构之复杂,无疑彰显了其雄心壮志。然而,上半年间,市场的焦点似乎更多地聚焦于阿里与腾讯等巨头,未曾想,快手却以“可灵”这一惊艳之作,悄然改写了文生视频赛道的竞争格局。

进入2024年,Sora的横空出世如同一颗重磅炸弹,搅动了整个AI界的春节氛围,各大公司纷纷紧急集结,共议应对策略。Sora那流畅无阻的体验,不仅吸引了众多技术爱好者的目光,就连教育领域的博主们也争相上线教程,企图在这波AI浪潮中分得一杯羹。一时间,谁能最快复刻“中国版Sora”,成为了业界热议的焦点,而阿里、百度及“大模型五虎”等自然成为了众矢之的。然而,令人意想不到的是,最终脱颖而出的竟是技术风格相对“淡然”的快手。

6月7日,快手正式推出了文生视频模型“可灵”(Kling),其支持长达2分钟视频生成的能力,以及即时开放的测试环境,迅速赢得了市场的热烈反响。可灵不仅成为了业内的热门话题,其上线一个月便吸引超50万人申请、服务超30万用户、生成超过700万条短视频的傲人成绩,更是让业界为之侧目。

可灵的意外走红,无疑给字节跳动带来了一丝尴尬与警醒。面对这一昔日“忽视”的对手所展现出的强劲实力,字节必须加快步伐,迎头赶上。据钛媒体最新报道,字节跳动已将AI大模型提升至集团“P0最高级别”的战略地位,足见其对此领域的重视程度。同时,抖音、剪映等多个核心团队也正紧锣密鼓地研发AI视频模型应用,力求在短时间内推出具有竞争力的产品,重振旗鼓,夺回市场主动权。

图片

做可灵,快、糙、猛

多位开发者对「市界」表示,可灵的上线与亮眼表现,在行业内也算是个意外。

「市界」近期以“黑猫”为创意灵感,在可灵、即梦及智谱AI新推出的“清影”三大AI视频生成平台中,分别输入了相同的创意指令,描绘了一幅雨天城市街道中黑猫穿梭的静谧画面。结果显示,可灵虽未完美捕捉黑猫疾驰的瞬间动态,但其呈现的视频却基本遵循了物理规律与场景逻辑。

相比之下,“即梦”版本显得尤为平淡,街道无积水反光,黑猫静止不动,仿佛时间被按下了暂停键;“清影”虽尝试营造积水倒影的效果,但黑猫行走姿态略显生硬,尾巴部分更是出现了明显的帧丢失现象,影响了整体流畅度。

据“硅星人”深入报道,可灵的问世是快手团队匠心独运、高效执行的结晶,仅耗时短短三个月,由一支仅二十余人的精英小队倾力打造。这支队伍的领航者,是快手视觉生成与互动中心的掌门人万鹏飞博士,其研究深耕图像/视频信号处理、计算摄影、计算机视觉及视觉生成前沿,致力于减少Loss函数等关键技术突破。

可灵的诞生,可追溯至快手内部一个低调重启的“噗叽”项目,该项目原本旨在利用AI将静态图片转化为生动有趣的2秒Gif表情包。今年初春的一次内部会议,万鹏飞的创意火花得到了快手高级副总裁盖坤(又名于越)的高度认可,并迅速决定将“噗叽”作为探索视频生成新领域的试验田。

“做可灵时,我们的执行策略可以用‘快、糙、猛’三字概括。”这是项目内部达成的共识,彰显了团队敢于尝试、勇于突破的决心。更令人振奋的是,可灵项目自启动之初便得到了快手创始人程一笑的鼎力支持,被明确为公司的战略级项目。盖坤更是多次强调:“公司资源全面开放,全力以赴支持可灵项目。”

数字人领域的创业者柯燃在接受「市界」采访时分析指出:“可灵之所以能够脱颖而出,很大程度上得益于快手长期以来在视频数据素材方面的深厚积累。在国内,能与快手在这一领域相抗衡的,恐怕唯有抖音。”这一评价,无疑是对可灵及快手团队创新能力与数据优势的充分肯定。

可灵风光的同时,字节显得有些落寞。

尽管“即梦”早在5月9日便正式宣布上线,并在6月17日作为首席AI技术支持力量,在备受瞩目的AIGC短剧集《三星堆:未来启示录》中精彩亮相,其在消费者市场(C端)的反馈与影响力,相较于快手在7月13日推出的AIGC短剧《山海奇镜》而言,显得较为平淡,未能激起广泛的社会回响。

7月中旬,市场一度流传字节即将公布类似Sora的文生视频技术突破性进展的消息,外界普遍解读为字节正蓄势待发,准备与可灵在AI视频生成领域展开正面较量。然而,字节方面随后向「市界」澄清,该传闻并不属实。实际上,7月17日的活动更偏向于一场深度技术交流盛会,而非新产品发布。活动由豆包大模型视觉基础研究团队的领军人物冯佳时亲自操刀主持,汇聚了字节内部的顶尖研究科学家及外部权威机构学者,共同进行了一场全英文的技术盛宴,深入探讨了AI视觉领域的最新研究成果与未来趋势。

看起来,字节的“大招”或许还需要等些时日。

图片

字节还没回过神

在当前文生视频赛道激战正酣的背景下,字节似乎错失了这场盛宴的最初光芒,这背后或许隐藏着其更为宏大的战略考量与布局复杂性。相较于快手集中火力押注“可灵”,力求以单点突破实现“一力降十会”的效应,字节的大模型蓝图则显得更为广泛且深远,其上半年的战略焦点更多地聚焦于与腾讯、阿里等巨头的较量之上。

字节在AI大模型领域的步伐,无疑是“激进”的代名词。仅两个多月前,它便率先在行业内掀起了大模型价格战的风暴,以破局者的姿态重塑市场格局。在字节跳动“FORCE原动力大会”上,基于自研豆包大模型的API服务横空出世,火山引擎总裁谭待更是直接亮出了震撼业界的“地板价”——0.0008元/千Tokens,这一价格策略不仅彰显了字节的雄心壮志,也迫使行业内的其他玩家不得不迅速调整策略,以应对这场突如其来的价格战。

字节的“发难”不仅让竞争对手措手不及,更在行业内引发了连锁反应。阿里云、百度文心大模型、腾讯云等纷纷跟进,宣布大幅降价,一时间,头部大模型的C端调用几乎全部免费,整个行业开始加速向更高层次的生态竞争迈进。

值得注意的是,字节的这一系列动作,不仅仅是价格战的简单策略,更是其将AI大模型视为集团最高级别战略的重要体现。火山引擎销售人员迅速响应市场,积极接触客户、推介产品,这一系列高效的市场行动,无疑为字节在AI领域的快速崛起奠定了坚实的基础。

综上所述,尽管在文生视频赛道的初期,字节未能如快手般迅速成为焦点,但其在大模型领域的深耕细作与激进布局,正逐步显现出强大的竞争力与影响力。未来,随着AI技术的不断成熟与应用场景的持续拓展,字节有望在这一领域实现更大的突破与飞跃。

图片

▲( 2024“FOECE大会”)

而最近,字节的“当家产品”豆包,增长得较为明显。

据Questmobile数据显示,截至2024年6月,在国内AIGC App中,豆包、天工、Kimi智能助手、猫箱增长亮眼——其中豆包流量排名第一。

图片

▲( QuestMobile)

与快手聚焦于特定领域的闪耀表现相比,字节如今的战略视野更为宽广,它似乎更倾向于构建一个涵盖基础大模型、AI应用层以及云市场在内的全方位生态系统。作为云市场中的后起之秀,火山引擎自2021年正式入局以来,便以“最年轻”的姿态挑战着传统巨头的地位,其成长之路充满了挑战与机遇。

对于字节而言,如何将基础大模型的深厚技术积累、丰富多样的AI应用层场景以及快速发展的云市场进行有效协同,已成为一个亟待解决的综合命题。这一命题不仅考验着字节的技术整合能力,更要求其具备敏锐的市场洞察力和前瞻性的战略布局。

近期,“光子星球”的报道揭示了字节“扣子”平台用户群体中的一个显著趋势:众多用户正积极探索如何将通过扣子平台创建的智能体、bot等AI产品无缝接入微信公号或小程序,这一现象背后,是用户对AI技术在实际应用场景中落地需求的迫切反映。

回顾过去,字节在AI应用平台的布局上展现出了惊人的速度。去年12月,字节在海外率先推出了“coze”平台,而仅数月之后,其国内版“扣子”便应运而生,迅速吸引了大量抖音体系商家的关注与参与,他们渴望借助这一平台实现商业价值的飞跃。

与此同时,腾讯在今年5月推出的“腾讯元器”平台,虽然标志着其在AI智能体创作与分发领域的正式入场,但在生态建设上显然还需加快步伐。相较于扣子平台已累积的233万次访问量,腾讯元器在打通小程序、公众号、客服订阅号等微信生态方面的进度尚显滞后。

在AI发展的初期阶段,无论是字节还是腾讯,都面临着用户教育的艰巨任务。然而,字节显然已经意识到,争夺AI时代的分发权,关键在于先声夺人。因此,它正以前所未有的力度推进AI技术的普及与应用,旨在通过构建更加开放、便捷的AI生态系统,为用户提供更加丰富的选择和更加优质的服务体验,从而在未来的市场竞争中占据先机。

图片

后发制人,尚有时间

在当前互联网行业的广阔舞台上,内容流量、电商流量以及资金资源均不匮乏的字节,即便在文生视频领域的短期竞争中稍显滞后,其长期内所蕴藏的后发制人潜力依然不容小觑。字节擅长以积极的市场策略迅速弥补差距,其“大力出奇迹”的打法,在业界早已有口皆碑。

近期,字节更是将目光投向了阿里巴巴,积极投身于整合大模型的战略布局之中。在6月26日的钉钉生态大会上,总裁叶军高调宣布了一项重要举措:除了集成阿里自家的通义大模型外,还将携手MiniMax、月之暗面、智谱AI、猎户星空、零一万物及百川智能等六家国内顶尖的第三方大模型,共同入驻钉钉平台。这一举措无疑彰显了字节构建“中国最开放AI生态”的雄心壮志,其开放包容的态度,无疑为行业树立了新的标杆。

与钉钉的开放策略相呼应,字节旗下的扣子平台同样展现出了强大的兼容性与创新性。该平台不仅稳固支撑自家的“豆包”大模型,还广泛接入了通义千问、月之暗面、MiniMax等一众外部优秀模型,形成了多元化的生态体系。尤为值得一提的是,6月14日扣子平台推出的“模型广场”功能,更是为用户带来了前所未有的互动体验。该功能允许用户自由挑选两个匿名模型进行内容生成比拼,并根据生成内容的表现进行打分PK,这一创新举措不仅激发了用户的参与热情,更促进了模型之间的良性竞争与持续优化。

综上所述,字节在AI领域的布局正逐步深化,其开放合作的姿态与持续创新的精神,无疑为未来的市场竞争奠定了坚实的基础。即便在短期竞争中面临挑战,字节依然具备后来居上、引领潮流的强大潜力。

图片

此外,字节近期在“AI+硬件”领域的探索步伐显著加快,通过一系列积极举措,包括战略收购在内,不断招贤纳士,以加速技术融合与创新。据“Tech星球”深入报道,字节旗下的PICO自去年下半年起,便全力投入到多款穿戴设备的研发中,这些设备如耳机、音响等,均将深度融合AI技术,为用户带来前所未有的智能体验。同时,字节豆包团队也在积极探索大模型与软硬件的结合应用,学习机、机器狗、机器人等硬件设备已逐步成为其试验田,展现出强大的应用潜力。

值得注意的是,字节在AI硬件领域的布局更显精细化与专业化。据36氪透露,字节AI硬件“D线”的掌舵人李浩乾,正是字节于今年3月收购的开放式可穿戴立体声耳机品牌Oladance的创始人,这一举措无疑为字节在AI耳机领域的快速崛起注入了强劲动力。而另一条“O线”的负责人同样来自字节收购的公司,直接向字节跳动技术副总裁洪定坤汇报,形成了高效协同、资源互补的工作格局。

转观文生视频这一新兴赛道,尽管市场热度初起,但包括字节在内的众多追赶者仍拥有宝贵的时间窗口。近期,一位开发者在接受「市界」采访时表示:“目前,我们主要利用可灵等工具进行构图和流程优化,尚未完全依赖其进行独立创作。”另一位短视频AIGC领域的博主则指出,可灵在文生视频方面仍有待优化,特别是难以保证虚拟人IP内容的一贯性。他更倾向于结合可灵的图生视频功能,通过人工辅助实现多角度动态视频的拼接与运镜效果。

对于国内某AI模拟交友产品的研发成员而言,当前的大模型应用市场仍处于探索阶段,商业化路径尚不明朗。然而,他坚信:“唯有通过广泛的用户参与和实际应用,才能推动产品的持续优化与迭代,为未来的商业化奠定坚实基础。”这一观点,无疑为整个行业指明了前行的方向。

来源:加一研究院

$快手-W(01024)$

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论