谷歌AI视频模型深夜炸场:4K分辨率+2分钟时长 又给OpenAI“来了一枪”
创始人
2024-12-17 20:21:37

《科创板日报》12月17日讯Sora正式发布仅8天后,“谷歌版Sora”的2.0版本——Veo 2便正式发布。

据谷歌官网显示,Veo 2可制作具有逼真动作和高质量输出的视频。其最高分辨率可达4K,时长可达2分钟以上。谷歌方面表示,Veo代表着高质量视频生成领域的重大进步。

除视频清晰度有所长进外,Veo 2对物理世界和镜头控制的理解也是惊人的:

这段画面的部分提示词是:低角度跟踪拍摄,18mm镜头。汽车漂移,留下光迹和轮胎烟雾。相机低速跟踪,捕捉到光滑的橄榄绿色肌肉车接近拐角时的画面。

该画面部分提示词为:特写镜头聚焦于一位女DJ的脸部,她美丽、浓密的黑色卷发勾勒出她的五官。她闭上双眼,沉浸在节奏中,嘴角挂着一丝微笑。当她随着节拍点头和摇摆时,相机捕捉到了她头部的细微动作

从上述案例可见,Veo 2在真实世界还原以及Prompt指令遵循方面都有不错的表现。而在谷歌官网发布的性能评估中,Veo 2同样打败了Sora Turbo、可灵、MiniMaX等一众海内外AI文生视频大模型。

对此,谷歌总结称,Veo 2在技术层面上的进步主要体现在三个方面。一是物理引擎的优化,这决定了AI视频模型对于现实世界物理规律的深入理解。二是摄影技术的集成,能够输出更为丰富的视觉效果。最后是人物表现力的提升,使人物动作和表情更具实感。

目前,Veo 2已被引入谷歌旗下视频创作工具VedioFX。就在上周,OpenAI正式推出Sora Turbo,向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

与此同时,国内文生视频进展不断。今年以来,国内企业开始加速研发并迭代AI视频生成产品,产品能力不断提升:

今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频;

相关内容

热门资讯

远望谷取得开放式图书无感智慧借... 国家知识产权局信息显示,深圳市远望谷信息技术股份有限公司取得一项名为“一种开放式图书无感智慧借阅机”...
《中华考工记》推多语种海外版 ... 中新网北京2月1日电 (记者 应妮)工业和信息化部与中央广播电视总台战略合作框架协议签约暨大型工业文...
以青春之名,向英雄致敬——学习... 以青春之名 向英雄致敬 向金城龙同志学习的倡议书 全市各级共青团、少先队组织,广大青少年朋友们: 寒...
原创 库... 最近,苹果在中国干了一件大事情,那就是原来定位高端,价格高达7999元的的iPhoneAir,直接降...
荣耀MagicBook 202... 2026年1月31日,数码博主“数码闲聊站”公布了三款荣耀笔记本电脑新品的核心配置。 博文中称,荣耀...