今年2月sora给整个行业带来了不小的震动,没想到几个月之后中国的视频生成大模型就发布了,而且还是老铁之家快手做的。为什么会是快手,这事不应该是抖音或者BAT大厂干成的事吗?

根据媒体披露的信息,2023年10月,快手重启了一个当时看起来不太起眼的项目“噗叽”,这是一个能把静态图片通过AI生成2秒Gif表情包的工具,可以说这是可灵研发的基础。这里我们要提到一个人,万鹏飞,快手视觉生成与互动中心负责人。今年3月他在快手公司的支持下带着20人左右的小团队,仅用3个月时间就做出了可灵。

要做出这样一个大模型产品需要几个条件呢?足够多足够干净的数据,这是燃料;有够强的算法大牛和团队,也就是算法;有足够多的卡,就是算力。而这三个恰好快手都具备。快手本来就是短视频内容平台,数据场景是天然存在的,所以相对其他大厂有先天优势。但快手在主观上早做了准备,数据不是凌乱的,而是常年对视频进行清晰地标注,做模型的时候可以直接拿过来用,所以它们比其他厂、比字节都要快。

市场上有个说法,快手手头能用做GPU算力的大卡只有字节的十分之一。算力不占优势,快手为什么还能第一个做成呢?一方面,可灵开始不到一个月,就获得了快手CEO程一笑的支持,把可灵视做公司战略级项目,所以可灵实际可调用的算力比较多。第二,快手近几年持续对算力优化进行投入,在算力有限的条件下提升了训练推理的速度和效率。

有人说可灵会很快改变快手甚至整个短视频的内容生态和商业生态,但在我看来落地的速度不会很快。你看可灵现在还处在报名内测阶段,一是快手的算力确实不够,二是文生视频使用起来经济成本很高。所以这两条决定了可灵客观上还不能大规模商业应用,指标性意义大于商业意义$快手-W(01024)$  

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论