作者:YBB Capital Zeke前言2月16日,OpenAI公布了最新的文本控制视频生成扩散模型“Sora”,通过多段涵盖的广泛视觉数据类型的高质量生成视频,展现了生成式AI的又一个里程碑时刻。不同于Pika这类AI视频生成工具还处于用多张图像生成几秒视频的状态,Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。除此之外该模型还体现出了模拟物理世界...
网页链接作者:YBB Capital Zeke前言2月16日,OpenAI公布了最新的文本控制视频生成扩散模型“Sora”,通过多段涵盖的广泛视觉数据类型的高质量生成视频,展现了生成式AI的又一个里程碑时刻。不同于Pika这类AI视频生成工具还处于用多张图像生成几秒视频的状态,Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。除此之外该模型还体现出了模拟物理世界...
网页链接
精彩评论