腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构
IT之家
2024-05-14 18:09:26

原标题:腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构

IT之家 5 月 14 日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在 Hugging Face 及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用

▲ 混元文生图效果

▲混元长文生图效果

升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,腾讯表示,混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。

运行该模型需要支持CUDA的英伟达 GPU,单独运行混元 DiT 所需的最低显存为 11GB,同时运行 DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元 DiT 则至少需要 32GB 的显存,腾讯表示他们已经在 Linux 上测试了英伟达的 V100和A100 GPU。

▲ 配置要求

据IT之家此前报道,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、成为首批通过评测的国产大模型,首批通过的大模型还有阿里通义千问、360智脑和百度文心一言。

相关内容

热门资讯

原创 传... 据外媒《The Information》6月8日报道,谷歌已向英特尔下达了超过300万颗张量处理器(...
ROS生态中的仿真工具:机器人... 机器人或许在现实世界中运作,但它们越来越多地在虚拟世界中被创造、训练、测试和优化。 在一台仓储机器人...
“每6秒下线一台空调”!探营美... 泰国春武里府,一座45个标准足球场大小的“超级工厂”,正以“每6秒下线一台空调”的效率全速运转,成为...
朱雀二号改进型发射成功 行业发... 北京时间2026年6月9日16时23分,朱雀二号改进型遥六运载火箭(ZQ-2E Y6)在东风商业航天...
深圳湾口岸12天“拼出”智慧卫... 深圳新闻网2026年6月10日讯(深圳特区报记者 张程 通讯员 刘根荣 王泽勋)近日,深圳湾口岸迎来...