北大深圳研究生院联合兔展智能“复现”国版Sora
南方都市报
2024-03-13 20:04:03

原标题:北大深圳研究生院联合兔展智能“复现”国版Sora

南都讯记者谢萌 作为AI大模型领头羊公司的OpenAI在今年春节前后发布了视频生成大模型Sora,引发广泛关注和讨论。近期,北京大学深圳研究生院-兔展智能AIGC联合实验室推出Open-Sora计划,旨在复现开源版的Sora,希望通过开源的方式,带动全球范围感兴趣的技术人员参与进来。

Open-Sora计划已于近期在GitHub上公开,其核心技术框架包括视频编解码模块、Diffusion Transformer模型和条件输入三大模块。在资源有限的情况下,该项目采用了计算更友好的2D + 1D Diffusion Transformer,同步还在推进除了文本控制外的更多条件控制的视频生成训练。

在3月12日的说明会上,兔展智能创始人董少灵介绍,目前Open-Sora计划基于已经搭好的训练框架,能够支持动态输入、多尺度、多分辨率的训练,对于可变比例、可变时长的视频已经取得了较好的生成效果,初步完成了第一阶段验证的任务。第二阶段将在有效框架基础上使用更多数据和更大算力,训练出20秒以上、720P清晰度的视频生成模型,实现该开源项目的目标;第三阶段作为延展目标,如果得到更多支持的情况下,会考虑进一步延伸拓展生成的泛化性,场景多样性等。

项目在GitHub上发布后,也有不少人工智能大V们转发关注,发布一周内Star超过5K (5000多名技术开发人员标星),登上GitHub Trend第一。“让AI普惠人类,需要有第二种选择,”董少灵表示,“OpenAI选择了闭源不再‘open’,我们发起这项计划,想把类似的技术开源给整个社群来使用,希望更多人参与到计划中来,项目也不是为了做娱乐视频,更是想打造成深植于产业、赋能产业发展的中国本土的视觉大模型。”

2023年,兔展智能联合北京大学深圳研究生院共同成立了AIGC联合实验室,旨在共同探索产学研协同创新发展的新路径,打造“TOP + TOP”科研与产业深度共赢的科创新范式。该项目的联合发起人、北京大学深圳研究生院信息工程学院助理教授、博士生导师袁粒则表示,“开源社区的信仰就是技术开放共享,希望通过开源的方式集合大家力量共同推动这件事。”

相关内容

热门资讯

Arm:客户近两年对AGI C... IT之家 5 月 9 日消息,Arm 在本周早些时候的 FY2026Q4 财报电话会议上表示,客户在...
专家解读|把握智能体发展机遇,... 2026年以来,OpenClaw广泛应用,在展现出智能体强大自主任务执行能力的同时,也暴露出智能体在...
蝉联冠军!祝贺安工大! 2026中国机器人大赛 暨RoboCup机器人世界杯中国赛 (RoboCup赛区) 近日在北京举行 ...
美国网络教育平台Canvas遭... 美国各地广泛使用的网络教育平台Canvas在7日遭遇网络攻击后服务一度中断,8日“已完全恢复在线并可...
经纬度:迎接AI智能体的“大航... 近日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》(以下简...