今天分享的是:大模型专题:视频大模型奇点时刻加速到来
报告共计:26页
《视频大模型奇点时刻加速到来》报告指出,自Sora发布以来,国内外众多公司推出视频生成模型。目前国内外视频生成大模型差距逐步缩小,基础功能具复制性,未来竞争或向抢占用户、提升粘性方向发展,需生成更高质量视频以提高一致性、文本指令遵循度和物理模拟能力。通过主观对比,我国Vidu、清影在文生视频领域可能处于第一梯队,生成时间短且复杂任务完成性好;图生视频整体效果优于文生视频,国内与国外差距缩小。视频大模型具备商用潜力,在办公、广告等多领域前景广阔。算法方面,视频生成模型算法主要有基于SD逐帧生成和基于时空Patches两种范式,前者易训练但视频一致性差,后者训练成本高但长度与一致性有保障。算力上,以Sora为例,其训练算力需求是GPT - 4的4.5倍,推理算力需求接近GPT - 4的400倍。数据方面,高质量数据是模型能力保障,用户数量可开启模型迭代“数据飞轮”。总之,视频大模型迎来重要发展时刻,各方面不断进步,有望在更多领域发挥重要作用,推动内容创作革命,为各行业带来新的发展机遇和变革动力。
以下为报告节选内容