几乎可以确定,至少在 2023 年的余下时光,AIGC 仍然会站在聚光灯之下,它的影响将持续在千行百业间生根发芽。
@数科星球原创
作者丨苑晶
编辑丨大兔
2023 年,AIGC 爆火。一时间,作为聊天机器人场景的 ChatGPT 家喻户晓。
全球化移动互联网企业 APUS 创始人李涛认为,人工智能已经掀起了新一轮工业革命,互联网将扛起先锋旗成为最先革新升级的领域,而这难得的进化机遇,也将打破现有行业格局,能够把握住此轮机遇的企业,未来将大放异彩。
为了能让读者从全球化视角了解科创企业如何看待这次人工智能浪潮,数科星球(ID:digital-planet)特邀 APUS 创始人李涛与该司多位高管共同探讨 AIGC 行业现状、发展困境与破局之法。我们同时希望有更多的有识之士与数科星球(ID:digital-planet)建立联系,共谋行业发展。
APUS 是一家全球化移动互联网公司,总部位于北京市。该公司成立于 2014 年,致力于为用户提供更专业,实用,创新的科技产品和服务,早期工具产品 APUS Launcher、APUS Booster、APUS Security 等为全球用户 “触网” 打开窗口, APUS 旨在通过简化用户体验、提高手机性能和提供更好的移动互联网服务来改善全球数亿用户的移动互联网体验。截至 2022 年,APUS 全球累计用户量已超 24 亿。
在最新消息中,APUS 已实现从互联网向人工智能企业的转变,并基于自研 “天燕大模型” 等人工智能底座,创新研发了智能问答大师、简笔成画、墨染等场景应用软件。
(以下所谓 AIGC 指 AI Generated Content 即人工智能内容生成技术,目前该技术已在文字、音乐、图像、视频等领域得到应用,并在行业内诞生了不少专注于此的技术型公司。)
01
数字化与人工智能的机遇
春光水暖鸭先知。作为一家全球化企业,面对 AIGC 的大势,APUS 比国内市场感知得更早。有内部员工形容,这种感觉是 “很复杂的” 的,有些血脉偾张,又有些紧张和焦虑。
“我们有一款塔罗牌在线产品,需要用到穆夏风格,专业设计师从灵感到完稿的时间以 “天” 计算,但 AI 的时间计量单位是 “秒”,这就是 AI 效率。”李涛对数科星球(ID:digital-planet)这样说。
在上述场景里,APUS 的产品用到了 AIGC 的文生图技术。正如我们先前的系列报道那样,在文生图的人工智能产品中,用户只需描述出对图片的基本诉求,系统便可即时输出人们想要的图片。目前,文生图类 AIGC 产品需要底层大模型支持,在这类大模型中有 Stable Diffusion、DALL·E、AltDiffusion 和 Painter 等多种产品。
大模型本着开源逻辑,这意味着,众多开发者都可依赖其开发面向消费者的终端产品。而除了上文所提及的文生图类场景外,AIGC 还有文生文(典型场景是 ChatGPT)、文生代码、文生视频、图生视频等多个发展方向。
总体来看,作为目前红得发紫的人工智能技术,AIGC 由于在算法、数据和算力等层面的突破已走出象牙塔来到了具体场景之中。这对于互联网企业的意义在于,自动生成内容能够极大提高互联网企业的生产力和生产效率,李涛将其形容为“提升企业内部效率,是 AI 工业革命的第一篇章”。
AIGC 首先 “炸” 开互联网企业的大门,在逻辑上是一种必然——因互联网的特性使然,该领域企业对国际主流技术趋势有着天然嗅觉,让互联网从业者变成了首先拥抱这项科技的用户。而在这种趋势下,AIGC 对各行各业的影响也将随之展开。
在我们已知的领域中,AIGC 已可以在营销、社交、内容创作和游戏等行业应用。据相关报道,AIGC 可以为全球拉动 14% 的 GDP 增长,相当于 15 万亿美元的经济贡献。可以说,至少在互联网界,AIGC 是一次让企业向数字化、智能化和高效化发展的重要推动力。
我们所看到的事实是,AIGC 正在以互联网为跳板走入千行百业中。
02
革了谁的命?利好了谁?
没有永远完美的产品,搜索引擎被倒逼。
2023 年,AIGC 的故事以近乎魔幻化的方式展开,其中最被人们关注的便是对搜索引擎的影响。早先,很多人认为搜索引擎有着 “近乎完美” 的商业模式。而如今,这种认知将被颠覆。
“搜索引擎是最需要进行快速革新的互联网产品,”李涛如是说。
作为老一代互联网人,李涛的职业生涯贯穿搜索引擎的黄金发展期,在他看来,搜索引擎的变革是必然——大体上,搜索引擎可以概括为 “抓取网页、提供索引及用户查询” 三个步骤。其大厦根基在与对互联网上已有内容的抓取和展示,变现手段主要依靠以竞价排名为主的流量型广告。在 AIGC 出现后,用户可以直接获取到通过自然语言学习后的查询结果,其内容更加个性化、更加详实且没有广告。这无疑是对搜索引擎产品逻辑和变现逻辑的巨大挑战。
在用户体验方面,自然语言和预训练聊天机器人所提供的答案有着强大的理解力、流畅性,较搜索引擎的关键词搜索有着质的差别。本质上,这是一种包含与被包含的关系(AIGC 包含了搜索引擎的用户需求,并创造了新的体验)。
“人类的思考依赖推理,而在推理中有两种思维方式,一个是演绎、一个是归纳,搜索引擎是一种严格遵循着 ‘逻辑归纳’ 的商业模式,但 AIGC 的出现让用户认识到,它可以做更多,”李涛强调,AIGC 既可以归纳(而且比搜索引擎的结果强得多)也可以演绎。从上文中系统秒级生成穆夏风格的塔罗牌设计图就可见一斑。并且,搜索引擎只提供历史信息,而 AIGC 可以提供世界上本没有的创作。
03
国内 AIGC 的现实困难
AIGC 虽好,但在国内却遇到了诸多问题。
“国内 AIGC 遇到的困难是综合性的,”李涛说。对比国外,尤其是底层大模型的大规模攻城略地,国内企业遇到的挑战被集中在数据孤岛之上。在李涛的理念里,构成大模型生态的四种要素(即场景、数据、算法和算力)国内企业拥有其中几项,但细致来看,每个要素在供给侧又不尽如人意。
首先,算力不先进。
在谈到这个问题时,他十分痛心。由于一些原因,国内高端芯片非常紧缺,国内云厂商主要采用的是英伟达的中低端性能产品,AIGC 所需要的专业化算力卡、算力芯片不能被有效满足。在调研国内顶尖芯片行业后,李涛更加确定了这个看法。
其次,算法不共享。
对于数科星球(ID:digital-planet)所关注的数字经济领域,这是个老生常谈话题。以往,巨头为防止竞争对手干扰到自家产品,忙于互相封杀 API,但在 AIGC 时代,这种观念仍没有被改变。比较而言,国外的开源生态日益繁盛,已出现大模型之间互相学习、协同进化的局面。
结果是,在 AIGC 领域,“重复造轮子” 使得底层大模型的成长性远低于国外同类产品。没有开源生态意味着,无论底层大模型亦或是表层应用软件,其数据积累和学习过程都要从头开始,造成了大量资源浪费的现象。李涛直言:“目前国内的 AIGC 还处于艰难起步阶段。”。
再次,芯片成问题。
“众所周知,我们的高端芯片是被卡脖子的,我们能够用到的芯片即便计算性能不差,但数据传输速度是被限制的,功耗也是很高的,我们需要做的工作还有很多,”他这样说。
以上问题均是国内 AIGC 企业所面临的现实挑战,在最乐观的预测中,国内企业仍和最主流的科技趋势相差 3-6 个月。也就是说,在未来的一段时间内,对于广大国内企业来说,其市场竞争的主旋律仍然会围绕追赶之间展开。
04
国内企业的突破之道
对于以上问题,一般而言,针对算力不足和数据割裂有以下几种措施:其一,优化 AIGC 芯片设计和性能、提高计算和处理效率;其二,推动产学研合作,加强企业间的合作;其三,推动数据共享,政府可以建立信息共享平台,加强数据共享,促进数据流通,降低数据采集和处理成本。
综合来看,解决算力不足和数据割裂问题是需要全社会共同努力的过程,需要政府、企业和个人的积极参与和努力。
对此问题,李涛给出了自己的建议:“必须继续加强国际化,全球化,才能解决算法不断迭代与更新问题”。在国内,算力资源较为集中,通常在以运营商为首等企业之中。李涛还呼吁,相关部门应该联合起来共同应对目前的局面。
“至少,我看到很多地方的超算中心还没有被有效利用,”他补充道。
除了硬件层面,推动国内 AIGC 产业发展的动力还有开源逻辑(开源是指将软件源代码公开,任何人都可以查看、使用、修改和分发该代码的一种软件开发模式)。
对于 AIGC 行业来说,开源能够为开发者提供更多的工具和资源,使得技术的研发速度更快、可以促进开发者之间的合作和知识共享,使得技术水平得到提高,创新能力得到增强,同时,开源可以促进技术标准的制定和推广,使得整个行业的技术水平得到提高,从而有利于 AIGC 领域的发展。
“一家公司用再多的程序员维护代码能量也是有限的,但开源不但可以让更多人来维护代码,还能为其他开发者带来便捷的体验,促进行业发展,何乐而不为?”李涛对此这样说。
实际上,在 OpenAI 等公司中,开源模式的优越性已然得到确立:其一,普通人可以帮其训练模型;另外在其上,还可以开发出更多的垂直智慧体。
在数科星球(ID:digital-planet)所接触的多家企业中,对开源的呼声越来越高。从另一个角度上说,开源的成功与否是决定国内 AIGC 成功的关键性因素。
05
蒸馏法:国产大模型的 “捷径”
目前,李涛所领导的 APUS 正在积极拥抱 AIGC,其利用 “蒸馏法” 训练自有模型收到了不错的效果。
在技术上,蒸馏法是结合已有的较大的预训练模型(如 BERT、GPT 等)训练子集的数据集。
在过程中,蒸馏法分准备阶段、过程阶段、微调和评估等几个步骤。其中,在第二步中,原则是让自己的小模型学习大模型的结果和概率分布已得到与大模型近似的表现能力。一般意义上,用小模型得到的模型因减少了计算量和储存空间,从而可更加适配移动设备和边缘设备等场景。
“在商业上,我觉得,每个企业都需要自己的中模型,”李涛说。在他看来,目前国内的大模型企业仍然绕不开算力有限的尴尬,而中模型的道路既经济又有商业前景。据数科星球(ID:digital-planet)了解,APUS 很早就在 AIGC 有所耕耘,目前已布局出一套自己的代码和产品矩阵。
当下,APUS 旗下 200 余款产品已全面启用 AIGC。一位内部专家称:“很多图片、视频已经用 AI 取代了人力。”对这家互联网公司而言,降本增效的作用十分明显。“我们有一款宗教和心理学产品,用 AI 的翻译水平已经有 90% 的准确度了,这比大多数翻译都要更好”,APUS 产品负责人称。
在 APUS 内部,目前已经创立利用 AIGC 工具提升工作效率的激励机制——员工会定期汇报其利用工具提升效率的进度进而获得一定比例的薪资优待。“如果提升 30%,那么我们加薪 10%;如果提升 50%,那么我们加薪 20%-30%,” 李涛总结。
结尾:李涛预估,今年 APUS 将有可能借助 AIGC 实现 200% 的商业增长。而这种依靠自研和结合大模型的转型,同样适用于其他互联网公司。
不过当我们把视角拉升至全行业,会发现,AIGC 的影响又是全方位和无差别的。对广大行业而言,它不仅仅是互联网行业的革命,也是一颗萌发的种子,即将引发不同行业的裂变反应。只不过,天然在互联网中拥有影响力和嗅觉的用户推倒了这第一张多米诺骨牌。
2023 年第一季度已经结束,回看这三个月所发生的种种,AIGC 从被质疑、被接受再到被拥抱可谓经历了魔幻的发展路线。数科星球(ID:digital-planet)几乎可以确定,至少在 2023 年的余下时光,AIGC 仍然会站在聚光灯之下,它的影响将继续在千行百业间生根发芽。
精彩评论