Sora的原理Diffusion Transformer - 知乎

苹果牛AIGC002

OpenAI的Sora之所以如此炸裂,关键在于它目前实现了文生视频的断层式领先。

其运作原理,说起来也很简单,它把单帧图像变成了连贯的视频!但其背后的难度又真的炸裂!

不像以前那种图片叠加的方法,Sora采用了Transformer加上扩散模型的魔法路线,让视频更连贯、更准确。这和之前的Runway和Pika的Diffusion Model完全不同,这是一个Diffusion Transformer方案。

虽然画质可能还不够高,但Who care?现在重点是视频的连续性和准确性。而不是之前Runway或者Pika的3秒又3秒的挤牙膏。

目前许多内测用户发现Sora在时间轴上表现特别出色,甚至可以生成开头不同但结尾一样的视频片段。这可比以前的视频生成方法高级多了!真的是大力出奇迹。


原网址: 访问
创建于: 2024-02-29 15:59:52
目录: default
标签: 无

请先后发表评论
  • 最新评论
  • 总共0条评论