支持文生视频和图生视频,阿里旗下大模型万相2.1宣布开源
创始人
2025-02-26 13:21:10

2月25日晚间,阿里巴巴宣布,阿里云视频生成大模型万相2.1(Wan)开源。此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。

通义万相是阿里云通义系列AI绘画创作大模型,可辅助人类进行图片创作,于2023年7月7日正式上线。今年1月初,通义万相视频生成模型宣布升级至2.1版,凭借着优秀的表现,在权威评测榜单VBench中登上榜首。

微信公众号“阿里云”截图

公开资料显示,此次开源共包括两个参数版本模型。

其中14B版本万相模型,在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置;1.3B版本万相模型,超过了更大尺寸的开源模型,还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。

演示材料显示,万相大模型在多个内部和外部基准测试中,均大幅超越现有的开源模型以及顶尖商业闭源模型。万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。在指令遵循能力方面,能够准确理解中英文长文本指令,还原各种场景切换、角色互动。

相关内容

热门资讯

魔兽世界:TBC周年服P2金团... 盘点魔兽世界TBC周年服二阶段金团最核心的掉落,敢问各位大兄弟是否能够实力拿下?速看! 一、奥的灰烬...
原创 E... EWC更换举办地,法国总统亲自发文确定,将在巴黎进行,2026年的电竞圈,正在迎来一个越来越明显的变...
原创 E... BLG电子竞技俱乐部,斩获2026全球先锋赛冠军之后,英雄联盟电竞圈进入短暂的休赛期。3月27日,随...
童趣战令上新!魔域口袋版西瓜甜... 在亚特大陆的冒险日常里,我像往常一样登录《魔域口袋版》,准备开启新一天的热血征程。刚进入游戏界面,那...
我国首个集成电路领域育人共同体... 原题:让国产替代从“可用”到“好用”!我国首个集成电路领域育人共同体在南京成立 5月22日,“芯火筑...