Meta 推出 SceneScript AI 视觉模型,利用可编程语言预测场景
IT之家
2024-03-25 22:55:52

原标题:Meta 推出 SceneScript AI 视觉模型,利用可编程语言预测场景

IT之家 3 月 25 日消息,据 Meta 公司官方新闻稿,该公司开发了一款名为“Scene”的视觉模型,该模型号称能够使用可编程语言来快速“建立”场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值。

▲ 图源 Meta 公司官方新闻稿(下同)

Meta 声称,相关方法能够高效且轻量地建立室内 3D 模型,号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”,并且相关形状数据具有“可解释性”,用户可以轻松阅读和编辑这些数据表示。

IT之家注意到,开发人员借鉴了大语言模型“预测单词”的方法来开发 Scene,以 Llama 模型为例,该模型可以根据前面的单词来预测句子的下一个单词,例如输入句子“The cat sat on the…”,模型会预测下一个单词可能是“mat”或“floor”。而 Scene 运用了相同的概念,即通过前序输入内容推出后文,并使用这些建筑学层面的描述重建出复杂的室内 3D 环境

相关内容

热门资讯

沉迷这款“多半差评”游戏的半个... 上线还不到一个月的《竞拍之王》,应该是这段时间最为矛盾的游戏。我甚至觉得就算把时间跨度放到今年内,都...
《欧陆风云5》发布迄今最大更新... Paradox Interactive近日为《欧陆风云5》推出了被称为“迄今最大更新”的大型补丁,其...
销量破百万后,《颂钟长鸣》创意... 在GDC大会上,Donkey Crew CEO兼创意总监Florian接受了第二次专访,围绕《颂钟长...
聚力青年智慧,赋能国企数智升级 来源:人民日报客户端云南频道 人民日报云南5月8日电,近日,云南省人民政府国有资产监督管理委员会举办...
以算电协同赋能新型能源体系 来源:经济日报 “十五五”时期是我国基本实现社会主义现代化夯实基础、全面发力的关键时期,也是我国加快...