这是AI生成的!
这里是美国
2024-02-16 16:10:25
0

原标题:这是AI生成的!

据OpenAI官网,OpenAI首个视频生成模型Sora发布,完美继承DALL·E3的画质和遵循指令能力,能生成长达1分钟的高清视频。

制作:环视频/韩雅莉

AI想象中的龙年春节,红旗招展人山人海。

有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。

一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅,电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间,独特的电影风格、采用35毫米胶片拍摄,色彩鲜艳。

竖屏超近景视角下,这只蜥蜴细节拉满:

OpenAI表示,公司正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量和符合用户提示的要求。

如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解,能准确解读提示,并生成表达丰富情感的引人入胜的角色。Sora还能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。

比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化。

一群纸飞机在茂密的丛林中翩翩起舞,在树林中穿梭,就像候鸟一样。

Sora还可以在单个视频中创建多个镜头,并依靠对语言的深入理解准确地解释提示词,保留角色和视觉风格。

对于Sora当前存在的弱点,OpenAI也不避讳,模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

此外,模型还可能会混淆提示的空间细节,例如左右不分,并且在处理随时间发生事件的精确描述方面也可能存在困难,比如跟踪特定的摄像机轨迹。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

技术方面,目前OpenAI透露的不多,简单介绍如下:

Sora是一种扩散模型,从噪声开始,能够一次生成整个视频或扩展视频的长度,

关键之处在于一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变。

与GPT模型类似,Sora使用了Transformer架构,有很强的扩展性。

在数据方面,OpenAI将视频和图像表示为patch,类似于GPT中的token。

通过这种统一的数据表示方式,可以在比以前更广泛的视觉数据上训练模型,涵盖不同的持续时间、分辨率和纵横比。

Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E3的重述提示词技术,为视觉训练数据生成高度描述性的标注,因此能够更忠实地遵循用户的文本指令。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地让图像内容动起来并关注小细节。

该模型还可以获取现有视频并对其进行扩展或填充缺失的帧。

Sora是能够理解和模拟现实世界的模型的基础,OpenAI相信这一功能将成为实现AGI的重要里程碑。

来源:每日经济新闻

相关内容

热门资讯

中上协走进长虹活动圆满结束 长... 10月15日至16日,中国上市公司协会开展了“走进上市公司——四川绵阳行”交流活动,协会会长宋志平率...
2024年Q3全球智能手机销量... 好消息来啦!根据Counterpoint Research的最新数据,2024年第三季度全球智能手机...
苹果宣布:用户可通过中国移动A... 【CNMO科技消息】10月18日,苹果与中国移动宣布,中国移动用户将可通过更多服务组合轻松订阅App...
千架无人机点亮阿联酋夜空 有这... 近日,在中华人民共和国成立75周年暨中阿建交40周年招待会间隙,阿联酋首都阿布扎比上演大型无人机表演...
【好物】小米Sound Pro... 全国领用 3C 数码 8~9 折政府补贴今日继续,小米 Sound Pro 旗舰音响新低,有需求的小...
新兵报到丨寓学于行赴徐圩 研学... 为了让学员们开拓视野、深化认识,10月17日,培训班安排了现场观摩,带领学员踏上了前往徐圩石化基地的...
深爱榜创办人袁子弹的创新致辞:... 深爱榜融媒体讯(张小葭报道)在近期举办的几场重要活动中,深圳市科学思维研究会执行会长袁子弹以一种前所...
消息称一加中端新机测试 IMX... IT之家 10 月 17 日消息,据博主 @数码闲聊站 爆料,一加中端新机测试 IMX906 主摄 ...
揭秘团播生意经:有中腰部主播月... 图片为粉丝分享的录屏截图 出品 | 搜狐科技 作者 | 张莹 编辑 | 杨锦 已经发展了十余年的秀场...
智能网络编程:技术进步与未来发... 网络编程概述 (Overview of Network Programming) 网络编程是计算机...
苹果iPad mini 7平板... 快科技10月18日消息,今天,iPad mini 7现身GeekBench跑分网站。 GeekBen...
价格战打了两年,越降价越贵?买... 价格战已经打了快两年了,很多等等党已经对“降价”习惯了。感觉车价还会越来越低,这是大家公认的趋势。 ...
华为Mate 70手机壳曝光:... 快科技10月18日消息,博主厂长是关同学晒出了华为Mate 70系列手机壳。 如图所示,保护壳证明M...
安吉新闻官方报道飞天云动亮相数... 近日,随着安吉官方新闻文字及视频报道飞天云动闪亮登场第三届全球数字贸易博览会,作为元宇宙数字文旅领域...
原创 小... 十一长假后,房东费费开始为自己的房子寻找租客。 为了避开中介,减少无意义的沟通。抱着试试看的想法,她...
专家建议 促进生成式大模型落地... “当前大数据应用广泛,但在数据应用时大数据并非总是比小数据好。”9月27日,由中国科协企业创新服务中...
什么是智慧监督大数据分析系统? 智慧监督大数据分析系统是一种利用现代信息技术,尤其是大数据技术,来提升监督工作的效率和精准度的平台。...
建设新网络,浇灌新业态!华为与... 摆脱了单一业务的限制,广电行业正在以内容服务商+网络运营商的新姿态拓展自身发展的空间和上限。与此同时...
湖北首个人形机器人年底亮相 湖北日报讯(记者张真真、通讯员曾宪雯、严浩)10月17日,记者从武汉东湖高新区新闻发布会上获悉,湖北...
山西电力首个IEEE国际标准获... 本报讯(记者杜鹃)日前,在电气与电机工程协会标准委员会(IEEE-SA)第25次标准讨论会议上(Ne...