可灵AI全系模型进入2.0时代视频及图像可控生成与编辑能力再升级_老虎社区_美港股上老虎

可灵AI全系模型进入2.0时代视频及图像可控生成与编辑能力再升级

自2024年6月发布以来，国产视频大模型可灵AI凭借其强大的生成能力和创新应用，持续推动视频创作智能化转型，为影视制作、文化传播、商业服务等领域的数字化升级注入新动能。4月15日，可灵AI宣布基座模型全面升级，正式推出可灵2.0视频生成模型与可图2.0图像生成模型，国产AIGC技术迈入更高阶的“多模态精准表达”时代。

undefined

“灵感成真”可灵AI2.0发布会现场。资料图片

近年来，随着深度学习技术的迅猛发展，AI大模型已经成为人工智能领域的重要研究方向和热点话题。AI大模型的意义不仅在于其强大的参数规模和学习能力，更在于其对解决现实世界复杂问题的潜力。这些模型可以通过对大规模数据的学习，自动发现数据之间的关联性和特征，从而实现对文本、图像等数据的高效处理和理解。在自然语言处理领域，AI大模型已经在文本生成、语义理解等任务上取得了令人瞩目的成绩。

随着科技的不断进步和数据的日益增长，AI全系大模型将在更多领域展现出其强大的潜力，为人类社会带来更多创新和进步。经常使用AI生成视频的创作者会发现，现在的AI模型还达不到一键成片的程度，仍需要斟酌每个镜头的提示词或参考图，输出的视频质量也不一定令人满意，需要多次尝试生成和修改。比较常见的痛点问题包括提示词响应有限、理解有误；画面运动幅度不够，有明显的运动瑕疵；人物表情不自然，动作不准确等。针对这些问题，可灵2.0在语义遵循、画面质量、动态质量、真实度、美感等方面都进行了完善迭代。

据快手副总裁、可灵AI负责人张迪介绍，在可灵AI上，85%的视频创作是通过图生视频完成的。截至目前，可灵AI已累计完成超20次迭代，全球用户规模突破2200万人，服务覆盖超1.5万开发者和企业客户。此次发布的2.0版本在画质清晰度、动态细节还原等核心指标上实现跨越式提升，支持更复杂的多场景融合生成，用户可通过API接口将AI能力快速嵌入工业设计、广告营销、教育培训等百余个行业场景。

快手高级副总裁、社区科学线负责人盖坤表示：“可灵AI的目标是让每个人都能用技术讲出好故事，通过精准的创意表达降低专业创作门槛。”

那么，如何实现这一目标备受市场各方关注。基础模型决定了生成效果的技术上限。为此，可灵AI推出了3项创新功能，从产品层面让视频生成更便捷了。其中，“多模态编辑”功能，允许用户通过输入图片或文字，对一段5秒的视频进行灵活修改和再创作，其可以针对用户上传的视频，替换、添加、删除元素，由此提高视频创作的可控性和迭代效率。而可图2.0的“图片编辑”功能，则是支持对任意图片进行指定区域的局部重绘以及更自由的多尺寸扩图，效果自然，与原图高度融合。

从模型基础能力到功能应用层面全面突破，意味着用户在创作全流程中的体验和最终效果都得到了提升。对创作者们而言，这是一套更加完整、强大且易用的创作工具，正在使AI创作变得更加自然、高效且富有表现力。

值得一提的是，可灵AI的实践价值已在多个国家级项目中得到验证。2月，黑龙江哈尔滨第九届亚冬会开幕式上，依托可灵AI的动态特效生成技术，冰雪舞台与实拍场景无缝融合，为观众打造“每一帧美如画”的沉浸式体验。更引人注目的是，亚冬会会歌《尔滨的雪》MV通过AI生成画面与实拍素材的创造性结合，构建出童话般的视觉世界，展现科技与艺术的深度对话。

在影视创作领域，快手推出的“可灵AI导演共创计划”联合9位导演，推出涵盖奇幻、志怪、动画等题材的9部AIGC实验短片。这些作品因媲美《爱•死亡•机器人》的视觉冲击力和叙事创新性，引发网友热议：“国产AI正在重塑影视工业流程。”而央视新闻首场AIGC大型晚会《AI奇妙夜》更以可灵AI为技术底座，集合百位创作者打造出虚实交融的舞台奇观，开创“文艺+科技”融合新范式。

undefined

可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇。资料图片

作为国内规模化落地的视频大模型，可灵AI正重新定义内容生产边界。在短剧领域，创作者通过AI生成分镜、场景及特效，将单集制作周期从周级压缩至小时级；企业用户则借助AI批量生成产品演示、虚拟主播等内容，营销效率提升超300%。随着2.0版本开放行业定制化训练，制造业可快速构建产品三维模型库，教育机构能一键生成历史场景复原视频，技术普惠价值持续释放。 $快手-W(01024)$

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

可灵AI全系模型进入2.0时代 视频及图像可控生成与编辑能力再升级

精彩评论

可灵AI全系模型进入2.0时代视频及图像可控生成与编辑能力再升级