谷歌发布新AI模型Genie:一张图片创建可互动的虚拟世界!可将任何图像转换成可互动的2D世界
和讯网
2024-02-27 20:02:12

原标题:谷歌发布新AI模型Genie:一张图片创建可互动的虚拟世界!可将任何图像转换成可互动的2D世界

新浪科技讯 北京时间2月27日晚间消息,谷歌周一发布了一种新的AI模型Genie,它可以接收文本提示、草图或想法,将其变成一个可以互动和玩耍的虚拟世界。

Genie拥有110亿个参数,可以说是一个基础世界模型。它由三部分组成,一个时空视频标记器、一个自回归动力学模型,以及一个简单且可扩展的潜在行动模型。

Genie通过了互联网上超过20万小时的2D游戏视频训练,目前还是一个研究预览版。它是在无监督和无标签视频的情况下进行训练的,能够学习各种角色的动作、控制和行动,做到一致性。

对用户而言,只要提供一段文本、一张草图,甚至是一个想法,Genie就会完成剩下的工作,生成一款2D游戏。谷歌称,Genie可以将任何图像转换成可互动的2D世界。

与Sora呈现出的高清晰度和高真实度相比,Genie似乎不那么在意画面真实性,而是将重点放在潜在动作预测上。

虽然这距离像《星际迷航》中那样的真正全息甲板还有一段路要走,但它确实表明,有一天走进一个房间,用几句话创造一场完全互动的冒险是可能的。

作为一个研究项目,Genie的上市日期尚未确定,以及是否会成为真正的产品还不清楚。但重要的是其用于内容生成的潜在技术和新方法,包括通向开放世界的未标记学习。

Genie带来的另一个重大突破是对真实世界物理的更深入理解,这可以用于训练机器人更有效地导航环境,或完成训练中没有经历过的任务。

谷歌称,Genie开启了图/文生成交互世界的时代,还将成为实现通用AI代理的催化剂。

相关内容

热门资讯

我国首个先进阿秒激光设施核心部... 在广东东莞松山湖科学城,中国散裂中子源附近的一片建设工地上,一座能“看见”电子运动的“国之重器”——...
6元时装创奇迹后,逆水寒又要删... MMO在游戏市场流行了数十年,玩法涵盖养成、战斗、换装等种种玩法,已经逐渐形成了固定的模式。 然而自...
梦幻西游109第一弥勒山有多硬... 梦幻西游新门派弥勒山因独特的二次封印机制,备受少侠们青睐。目前,已有大量PK团队转入该门派,并积极尝...
中国移动29元套餐怎么样?这份... 你是不是也在网上刷到过一堆29元月租的移动套餐广告?看着那100G的流量宣传,心里直痒痒,但又不敢下...
黑洞的引力会随着时间的推移衰竭... 在宇宙的众多奥秘中,黑洞一直是最神秘且令人着迷的天体之一。黑洞拥有极其强大的引力,甚至连光都无法逃脱...