Sora/可灵/海螺/混元等大PK!多场景对比,现在谁是最强视频生成模型?
创始人
2024-12-11 16:00:55

奇月 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI的正式版 Sora终于上线了!

不过,在Sora缺席的10个月里, Runway可灵海螺混元等等模型都横空出世,有的甚至都卷出了自己的特色风格和功能,比如Runway的多帧修改、可灵生成的表情更加自然、海螺的二次元风格等等。

接下来我们就来一起看看,Sora和这些模型的对比效果究竟如何吧!

Round1:对比Runway

Runway是美国目前最受欢迎的视频生成模型之一,很多创作者已经用它来进行视频生产了。

下面我们就一起来看看3个Runway Gen3与Sora的对比

场景一:罗马教堂风的视频

先让两个模型都生成一些罗马教堂风的视频,可以看出来两个模型的重点不太一样,Sora生成了一个会议的场景,而Runway生成的视频更类似于节日聚会。

场景二:生成人物行走视频

这次生成的是一个男人穿着圣诞衣服在冬天的雪地里行走,两个模型的生成效果都很不错,Sora生成的更有故事感一些,还有背景变换和镜头切换。

场景三:根据输入的靴子图片自动生成视频

这次Sora的表现就出现了一些反常识的现象,从静止的靴子里面又出现了另一双走动的靴子,Runway生成的效果就好多了。

有网友看完也是立马锐评到:看起来OpenAI是用UI设计来弥补模型效果不佳

Round2:对比可灵

对比完两个外国模型,把我们国产模型也拉出来比划一下!

首先请出的是非常受欢迎的 可灵模型,不仅是这次效果对比中有很多网友都用到了它,在过去的几个月中可灵也收获了很多用户。

场景一:Sora VS 可灵 VS Runway

金毛狗狗在美术馆中奔跑(Sora展示的官方场景之一)

三个模型在光影处理、动物毛发光泽和运动姿态方面处理得都很优秀,这一局有点难分上下,评论区里面喜欢Sora和可灵的都有。

场景二:Sora VS 可灵

根据输入的图片生成视频,没有提示词。

可灵生成的视频看起来似乎动作更加流畅一些,不过Sora的画面切换也是很有蒙太奇的感觉。

Round3:对比海螺、混元

国产模型还有更多选手申请出战!

接下来有请海螺模型和混元模型上场。海螺自从推出以来就一直在VBench榜单上名列前茅,混元模型虽然开源不久,但是也有很多艺术家都进行了创作尝试。

下面一起看看他们的表现:

场景一:Sora VS 可灵 VS 海螺,图生视频

这道题就是一个非常考验模型想象力的题目了,同样是图生视频,三个模型根据一个人站在金字塔下的身影进行视频生成。Sora和可灵的主题都比较偏向“末世”的感觉,海螺有点“异世界”战斗即视感。

场景二:Sora VS Runway VS 可灵 VS 海螺

输入是“维京演员的情感表现,摄像机推进至演员皱眉的脸部”。

Sora生成的视频中还有拍摄演员的视角变化,很有趣。可灵和海螺在处理面部表情时更加自然。

场景三:Sora VS 可灵 VS 混元

再来看看最后一个测试,让模型们幻想月球上面宇航员的活动。

可以看出来,每个模型都有自己的偏好,Sora的视频镜头变化更多、可灵的场景更加细致、混元的更有故事感。

Round4:视频忠诚一致性检测

网友Shaun Ralston还用自己的猫猫测试了一下Sora生成视频中物体的一致性。

首先来看看他的真猫写真:

下面都是Sora根据输入的图像生成的AI猫猫图像,看起来基本上和真实的猫差别不大,而且视频中的动作也非常自然。

One More Thing

Sora正式版推出之后,大家最关心的除了效果可能就是 价格了。

相关内容

热门资讯

两会好声音|市人大代表刘武:大... “我主要关注算力回城、边缘计算等方面,因为随着人工智能的不断发展,社会对算力的要求越来越高。”成都市...
“极数”数据大模型(LimiX... 中新社河北雄安1月31日电 (裴国荣 韩冰)2026年雄安新区“人工智能+”创新生态系列活动1月31...
黄仁勋:英伟达与联发科合作打造... IT之家 1 月 31 日消息,据中国台湾地区媒体《经济日报》今天报道,英伟达创始人兼 CEO 黄仁...
字跳申请用于处理视频的方法专利... 国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“用于处理视频的方法、装置、设备、介质和...
原创 得... 美国得克萨斯州又出招了!州长阿博特最近签署新令,全面禁止州政府设备使用来自中国的软件和硬件,从百度、...