曝DeepSeek-R2将于下月发布 总参数量达1.2万亿
创始人
2025-04-30 04:20:43

【太平洋科技快讯】近日,据相关曝料透露,深度求索计划于下个月发布其下一代AI大模型DeepSeek-R2。据悉,该模型在性能和成本上都取得了显著突破,并实现了全产业链的自主可控,有望对现有AI服务市场产生重大影响。

DeepSeek-R2采用了混合专家模型(MoE)架构,并结合了智能门控网络层(Gating Network),以优化高负载推理任务的性能。这种架构通过动态分配计算资源,使得模型能够更灵活、高效地处理复杂任务。此外,DeepSeek-R2的总参数量达到1.2万亿,几乎是上一代DeepSeek-R1的6710亿参数的两倍。

在训练和推理性能上,DeepSeek-R2表现出色。基于华为昇腾910B芯片集群进行训练,该模型在FP16精度下达到512 PetaFLOPS的计算能力,芯片使用效率高达82%,这一性能相当于英伟达上一代A100训练集群的91%。在推理方面,DeepSeek-R2的速度达到每秒320 tokens,比前代模型有显著提升,并且在复杂逻辑推理任务上的准确率提升了83%。

此外,DeepSeek-R2预计将比GPT-4的成本降低97%,这预示着其可能颠覆现有AI服务的定价模式。分析师预计,DeepSeek-R2的定价将显著低于OpenAI的同类产品,这无疑将极大地提升其市场竞争力。

相关内容

热门资讯

11月车市数据出炉,这些板块又... 2025年12月11日,中汽协发布了最新一期的产销数据。数据显示,2025年11月,我国汽车产销分别...
用小井盖讲好成语故事 (来源:邯郸日报) 转自:邯郸日报 鸡泽县虹光铸造有限公司产品展厅内,客户正在了解产品情况。 祁鹏...
2025年最全攻略:什么手机卡... 办卡:微 信 公 众 号 搜【 可可 找卡】,每天更新运营商官方高性价比套餐!帮你精准匹配适配流量方...
原创 被... 文 | 钱钱 编辑 | 阿景 今年CES展会刚结束,深圳南山区乐普大厦15楼的“巴别舱”会议室里,田...
腾讯AI,开始发力了 在AI这场必赢战役上,一直被认为相对温和的腾讯,最近开始发力了。 据The Information周...