重磅!OpenAI首个视频生成模型发布,1分钟流畅高清,效果炸裂
每日经济新闻
2024-02-16 12:41:16
0

原标题:重磅!OpenAI首个视频生成模型发布,1分钟流畅高清,效果炸裂

OpenAI首个视频生成模型发布:1分钟流畅高清 效果炸裂

每经编辑:毕陆名

据OpenAI官网,OpenAI首个视频生成模型Sora发布,完美继承DALL·E 3的画质和遵循指令能力,能生成长达1分钟的高清视频。

AI想象中的龙年春节,红旗招展人山人海。

有紧跟舞龙队伍抬头好奇官网的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。

一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅,电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间,独特的电影风格、采用35毫米胶片拍摄,色彩鲜艳。

竖屏超近景视角下,这只蜥蜴细节拉满:

OpenAI表示,公司正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量和符合用户提示的要求。

如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解,能准确解读提示,并生成表达丰富情感的引人入胜的角色。Sora还能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。

比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化。

一群纸飞机在茂密的丛林中翩翩起舞,在树林中穿梭,就像候鸟一样。

Sora还可以在单个视频中创建多个镜头,并依靠对语言的深入理解准确地解释提示词,保留角色和视觉风格。

对于Sora当前存在的弱点,OpenAI也不避讳,模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

此外,模型还可能会混淆提示的空间细节,例如左右不分,并且在处理随时间发生的事件的精确描述方面也可能存在困难,比如跟踪特定的摄像机轨迹。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

技术方面,目前OpenAI透露的不多,简单介绍如下:

Sora是一种扩散模型,从噪声开始,能够一次生成整个视频或扩展视频的长度,

关键之处在于一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变。

与GPT模型类似,Sora使用了Transformer架构,有很强的扩展性。

在数据方面,OpenAI将视频和图像表示为patch,类似于GPT中的token。

通过这种统一的数据表示方式,可以在比以前更广泛的视觉数据上训练模型,涵盖不同的持续时间、分辨率和纵横比。

Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示词技术,为视觉训练数据生成高度描述性的标注,因此能够更忠实地遵循用户的文本指令。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地让图像内容动起来并关注小细节。

该模型还可以获取现有视频并对其进行扩展或填充缺失的帧,请参阅技术论文了解更多信息(晚些时候发布)。

Sora是能够理解和模拟现实世界的模型的基础,OpenAI相信这一功能将成为实现AGI的重要里程碑。

每日经济新闻综合OpenAI官网

每日经济新闻

相关内容

热门资讯

培育科技创新的“热带雨林” 新华社成都10月17日电从成都市中心一路向南,四川天府新区的“心脏”坐落着一座极具“科幻感”的岛屿—...
智能互动媒体:重塑信息传播与用... 互动媒体:重塑信息传播的未来 Interactive Media: Reshaping the F...
原创 双... 随着双11促销的开启,很多智能手机的价格都跌到了新低,这也是网友们选购手机的最佳时机。本次推荐4款售...
未来已来!当废秸秆可以成为服装... (记者 崔倩)近日,中国科学家利用秸秆等生物废料,成功开发出环保型乙二醇生产新技术。我国是生产和消费...
全国首个!徐汇“数链空间”启用... 10月18日,徐汇区“数链空间”暨上海市区块链技术创新生态集聚空间揭牌仪式在城开国际大厦举行。徐汇此...
股价坐上“过山车”,英伟达怎么... 作者|路世明 编辑|大 风 2024年对于英伟达来说,注定是不平凡的一年。 今年以来,英伟达股价已经...
宁夏银川举行“百日攻坚战”项目... 中新网银川10月18日电 (记者 李佩珊)10月18日,宁夏银川市举行“百日攻坚战”项目签约和开工推...
中上协走进长虹活动圆满结束 长... 10月15日至16日,中国上市公司协会开展了“走进上市公司——四川绵阳行”交流活动,协会会长宋志平率...
2024年Q3全球智能手机销量... 好消息来啦!根据Counterpoint Research的最新数据,2024年第三季度全球智能手机...
苹果宣布:用户可通过中国移动A... 【CNMO科技消息】10月18日,苹果与中国移动宣布,中国移动用户将可通过更多服务组合轻松订阅App...
千架无人机点亮阿联酋夜空 有这... 近日,在中华人民共和国成立75周年暨中阿建交40周年招待会间隙,阿联酋首都阿布扎比上演大型无人机表演...
【好物】小米Sound Pro... 全国领用 3C 数码 8~9 折政府补贴今日继续,小米 Sound Pro 旗舰音响新低,有需求的小...
新兵报到丨寓学于行赴徐圩 研学... 为了让学员们开拓视野、深化认识,10月17日,培训班安排了现场观摩,带领学员踏上了前往徐圩石化基地的...
深爱榜创办人袁子弹的创新致辞:... 深爱榜融媒体讯(张小葭报道)在近期举办的几场重要活动中,深圳市科学思维研究会执行会长袁子弹以一种前所...
消息称一加中端新机测试 IMX... IT之家 10 月 17 日消息,据博主 @数码闲聊站 爆料,一加中端新机测试 IMX906 主摄 ...
揭秘团播生意经:有中腰部主播月... 图片为粉丝分享的录屏截图 出品 | 搜狐科技 作者 | 张莹 编辑 | 杨锦 已经发展了十余年的秀场...
智能网络编程:技术进步与未来发... 网络编程概述 (Overview of Network Programming) 网络编程是计算机...
苹果iPad mini 7平板... 快科技10月18日消息,今天,iPad mini 7现身GeekBench跑分网站。 GeekBen...
价格战打了两年,越降价越贵?买... 价格战已经打了快两年了,很多等等党已经对“降价”习惯了。感觉车价还会越来越低,这是大家公认的趋势。 ...
华为Mate 70手机壳曝光:... 快科技10月18日消息,博主厂长是关同学晒出了华为Mate 70系列手机壳。 如图所示,保护壳证明M...