OpenAI发布首款视频生成模型Sora - {$web_name} 相比制作游戏的物理引擎

OpenAI亮相首款影像生成模型Sora

亮相时间:2024-02-16 15:59:14来源:逗游作者:逗游网

Alien HopAlien Hop人物好玩的休闲开心小游戏
  • 游戏类别:休闲益智
  • 游戏大小:0 M
  • 游戏语言:简体中文
  • 游戏版次:v1.0.0
访问查看 游戏专题

ChatGPT开发团队OpenAI亮相了新近的影像生成模型“Sora”,此模型可以依据文字指令能生成熟达1分钟的高清影像,并且有一定的“现实模拟”能力,相比制作游戏的物理引擎,其上限要高得多,清晨2024时尚穿搭,相关话题阅读量破亿下面带来详尽说明。怀念过去一览

OpenAI亮相首款影像生成模型Sora

1.他们能训练出这个模型的基础是:找到了一种统一的用文本刻画影像材料的范式,得以让众多的影像以及对应的刻画材料去训练模型,得到这个模型能力就是文本和视觉呈现之间的某种互相生成关系(能力),那如何得到众多带有相应文本字幕的影像呢?

他们使用了 DALL·E 3 中的重构字幕技术(原来是针对图片的)到影像。先是训练一个高度刻画性的字幕生成器模型,然后使用它为训练集中的所有影像生成文本字幕。 可以想见,快速显卡热点训练及使用模型耗费的算力惊人,所以不太或许在短暂内大范围启动;

OpenAI亮相首款影像生成模型Sora

2.大的框架是:研究模型+时空补丁,基于深度进修的研究模型,让一个随机噪声分布(指向图像的业内奥斯卡一览)转变成有价值的图像或影像信息,而时空补丁,定义了一个时间序列,使画面的的转变符合时间逻辑;

3.Sora 可以采样宽屏 1920x1080p 影像、垂直 1080x1920 影像以及介于两者之间的所有影像。由于是直接生成而不是裁剪影像,在取景,动向效果上也有一定长处;

OpenAI亮相首款影像生成模型Sora

4.这个模型还有几个出人意料但合理的能力:

a.它可以从一个时间点,向前或者向后去延伸影像,也就是说以某个画面为基点,生成这个时点之前的一段影像或之后的一段影像;

b.自如改变影像的风格和生态;

c.经由插值方式自然的将两个影像连接起来;

d.这一点相当重大,就是这个模型涌现出了一定的“现实模拟”能力,在展示影像中我们目睹的各异的镜头使用,含有 3D画面的一致性(比如同一物体由于镜头转变,呈现出的在视觉上维持形状的一致),还含有现实物体的交互(比如要面包后面包上的咬痕)并非刻意设计,或者“建模”的结局,而是自然涌现的,这点我们在纯语言模型上已然见识过了。

而在这个模型上面涌现出的能力,用文章中的原话来刻画“是开发物理和数字全球以及日常在其中的物体、动物和人的强大模拟器的一条有前途的道路。”

相关阅读

《使命召唤15》数字豪华加强版上架Xbox Live商城 售价900元

《新武林群侠传》将于2015年3月降成 新养成界里尾度表态

掀竿起热血燃 《战龙乡》足游解释公服新体验

魅族千元新机魅蓝Note本日开卖 抢抢抢!

兔子不喜欢黑夜的故事

回尽挽救强势开战 《次元战役》SS级豪杰萨殿下调回回

小米新产品暴光:“番笕”?

《写真女友Kiss:减强版》推出“真空引诱服拆” 上里看深V祸利

《战场女武神4》新宣传片公布 全新兵种加入战场

华为回应暂无别的足机厂商接进鸿受:做与没有做是贸易挑选

《河洛之新武林群侠传》2015年4月20日正式出售

粉丝6年心血《洛克人:出错者的复恩(Megaman:Revenge of the Fallen)》开放下载 典范《洛克人》重获重逝世

深度快充技术太真实了年初本周话题讨论,每一句都扎心健康养生报道广州银行利率动态济南网友热议彩蛋解析5G网络资讯清晨2024娱乐头条,适合发朋友圈回顾赵丽颖消息权威双11预售趋势粉丝互动热点