源Yuan 3.0 Flash基础大模型开源发布_资讯_雁台游戏网

源Yuan 3.0 Flash基础大模型开源发布

创始人

2025-12-31 19:01:10

IT之家 12 月 31 日消息，浪潮旗下 YuanLab.ai团队 12 月 30 日开源发布源 Yuan 3.0 Flash 多模态基础大模型。

Yuan 3.0 Flash 是一款 40B 参数规模的多模态基础大模型，采用稀疏混合专家（MoE）架构，单次推理仅激活约 3.7B 参数。

Yuan 3.0 Flash 提出和采用了强化学习训练方法（RAPO），通过反思抑制奖励机制（RIRM），从训练层面引导模型减少无效反思，在提升推理准确性的同时，大幅压缩了推理过程的 token 消耗，降低算力成本。

Yuan 3.0 Flash 由视觉编码器、语言主干网络以及多模态对齐模块组成：

语言主干网络采用局部过滤增强的 Attention 结构（LFA）和混合专家（MoE）结构，在提升注意力精度的同时，降低训练与推理的算力开销；
多模态方面，采用视觉编码器，将视觉信号转化为 token，与语言 token 一起输入到语言主干网络，通过多模态对齐模块实现高效、稳定的跨模态特征对齐；
同时，引入自适应图像分割机制，在支持高分辨率图像理解的同时，降低显存需求及算力开销。

在企业场景的 RAG（ChatRAG）、多模态检索（Docmatix）、多模态表格理解（MMTab）、摘要生成（SummEval）等任务中,Yuan 3.0 Flash 的表现已优于 GPT-5.1。

在多模态推理与语言推理评测中，Yuan 3.0 Flash（40B）精度接近 Qwen3-VL235B-A22B（235B）与 DeepSeek-R1-0528（671B），但 token 消耗仅约为其 1/4 ~ 1/2，降低了企业大模型应用成本。

Yuan 3.0 Flash 全面开源，全系列模型参数和代码均可免费下载使用，IT之家附开源地址如下：

上一篇：腾讯、字节、阿里们的出海一年：收缩、重构与真正的全球化

下一篇：2025年终回顾 | 中国电信推动AI智能体融入行业　让成果看得见、用得上

相关内容

热门资讯

我市以“数”赋能护航冰雪天气城... 自1月19日起，面对持续冰雪天气，我市迅速启动应急响应，以“智慧城市”建设成果为依托，创新构建“一图...

2000元预算怎么花？2026... 在2000元价位段，手机市场的竞争愈发白热化。这个预算既能避开千元机的性能短板，又能享受到旗舰技术的...

原创狼... KPL精彩赛事依旧在火热进行中，这一次是狼队和RW的对决，对于双方来说，这场比赛的胜负至关重要，关注...

原创 L... 经过漫长的休整期之后，重组的LPL 2026第一赛段终于在1月14日，正式拉开序幕。各支重组之后的队...

桂林飞宇取得夹持设备专利，可以... 国家知识产权局信息显示，桂林飞宇创新科技有限公司取得一项名为“一种夹持设备”的专利，授权公告号CN2...