deepseek,AI算力支出超160亿遭遇美国openAI全新O3-mini模型反击
创始人
2025-02-05 20:01:46

目前,DeepSeek投入超140亿元(19.96亿美元)用于算力建设,购置了6万张英伟达GPU卡,包括1万张A100、1万张H100、1万张特供版H800和3万张特供版H20。与此同时,华为、腾讯、阿里等国内主流云平台已集体接入deepseek

中国AI模型DeepSeek引发的全球热议持续了近半个月,美国OpenAI公司终于推出新模型予以回应。北京时间2月1日凌晨,OpenAI CEO奥尔特曼(Sam Altman)在两周前的预告后,正式发布了AI推理模型o3-mini,该模型在ChatGPT和API服务中上线。o3-mini的响应速度比前代o1-mini提升了24%,答案准确性也有所提高。

对于免费用户,ChatGPT首次提供了有限速率的o3-mini版本,速率限制与现有的GPT-4o类似;Plus用户则可选择更高智能的o3-mini-high版本;而每月支付200美元的Pro用户则能无限使用o3-mini和o3-mini-high。在API层面,o3-mini的输入价格为1.10美元/百万token,输出价格为4.40美元/百万token,比o1-mini便宜63%,比满血版o1便宜93%,但仍是GPT-4o mini价格的7倍左右。

OpenAI表示,o3-mini的发布是公司在追求高效能智能技术道路上的又一重要里程碑。通过优化科学、技术、工程和数学领域的推理能力,同时保持较低的成本,OpenAI致力于让高质量AI技术更加普及和易于使用。

在过去的一周里,DeepSeek的R1和V3两款开源AI模型彻底颠覆了业界对“尺度定律”(Scaling Law)的传统认知。这两款模型不仅展现了卓越的性能,更以不到OpenAI二十分之一的算力成本,引发了OpenAI内部的强烈震动。这一突破甚至让华尔街开始质疑:AI公司是否真的需要投入巨额资金在算力上,才能实现AGI模型的迭代?受此影响,英伟达股价一夜之间暴跌17%,市值蒸发近6000亿美元。

然而,根据SemiAnalysis的分析,外界普遍认为DeepSeek拥有5万张H100 GPU计算卡,但实际上,DeepSeek的算力储备更为庞大。该机构指出,DeepSeek共堆砌了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“特供版”H800以及3万张“特供版”H20。这些设备的总体拥有成本(TCO)超过140亿元人民币(约合19.96亿美元),其中服务器资本支出(CapEx)达12.81亿美元,运营成本为7.15亿美元。这一庞大的算力投入,无疑为DeepSeek的技术突破提供了坚实的后盾。

DeepSeek在MoE架构算法和系统软件层面有诸多创新,其启示在于,如何在算力有限的情况下,通过算法和软件协同创新,挖掘硬件极致性能,这对中国AI产业发展意义重大。他还指出,预训练模型完成后的后训练阶段十分关键,包括生成、推理和微调阶段,各阶段负载特点不同,并行策略也需优化,要从整体流程考虑,同时解决负载不均衡问题。

如今,o3 mini和DeepSeek R1都运用大量监督微调 (SFT)、强化学习 (RL) 、合成数据以及稀疏化MoE等技术。苹果公司研究团队和麻省理工学院合作发表的研究显示,稀疏性是模型发展的关键要素,DeepSeek通过关闭网络部分,能在较低计算能力下取得相同甚至更好的效果,有效利用有限计算能力成为模型发展的关键。

AI独角兽零一万物创始人李开复曾提到,现在一个模型训练仅用2000张GPU,训练周期一个半月,成本300多万美元,仅为马斯克xAI成本的1% - 2%。在AI技术快速发展的当下,OpenAI与DeepSeek的竞争走向值得关注,谁能在这场技术与资本的较量中脱颖而出,让我们拭目以待。

SemiAnalysis指出,到目前为止,“降本增效”模式成效显著。算法每年进步速度快4倍,这意味着实现相同功能,每年所需计算量会减少至原来的四分之一。随着时间推移,得益于算法的改进与优化,成本降低了10倍,能力却提升数倍 。

Anthropic首席执行官Dario Amodei也认为,更快的算法进步速度能带来10倍的提升。以GPT - 3质量的推理定价为例,成本已下降1200倍。

大模型推理成本下降是必然趋势。OpenAI在发布o3 mini时就表明,团队降低了token价格。自推出GPT-4后,每个token价格降低95%,同时还维持着顶尖的推理能力。此外,有消息称OpenAI准备开源,完整版o3最快几周内上线。

从价格和性能等维度来看,o3-mini是OpenAI目前性价比极高的模型之一。从相关数据可见,其多项技术能力超越了DeepSeek R1。

此前,奥特曼首次正面回应开源问题,坦言:“没错,我们正在探讨。我个人觉得在某些方面,我们或许站在了历史错误的一方,必须探寻不同的开源策略。不过,OpenAI内部并非所有人都认可这一观点,而且这也不是我们当下最优先处理的事务。”这是他首次公开承认OpenAI的闭源策略存在失误。

在DeepSeek引发的热潮推动下,奥特曼终于有了开源推理o1或基座GPT模型的打算。一旦实施,在一定程度上,这无疑将会是AI领域的一个突破性事件 。

今晨,OpenAI发布o3-mini模型,包含高、中、低三个版本。奥特曼称模型暂未集成思考技术,但会很快上线。

官方表示,o3-mini在科学、数学和编码领域表现出色。经测试,56%的测试者更青睐o3-mini给出的答案,在处理复杂现实问题时,重大错误率降低了39%。在中等推理难度下,o3-mini在AIME和GPQA等极具挑战性的推理与智力评估中,表现与o1相当。和o1-mini相比,o3-mini答案更准确清晰,推理能力也更强。

OpenAI发布的o3-mini研究论文显示,该模型在多种公开数据及内部定制数据集上完成预训练,这使得它在部分基准测试中表现与前沿水平相当。OpenAI计划让用户通过ChatGPT o3-mini搜索互联网并汇总结果,期望将其打造成实用且安全的模型。

在幻觉问题上,OpenAI披露,o3-mini在PersonQA数据集上的幻觉率低至14.8%,远低于4o的52% ,同时PersonQA准确率并未大幅下降。整体来看,o3-mini与OpenAI o1-mini表现相近,不过在模糊性、明确性问题的准确性上稍有降低

相关内容

热门资讯

梦幻西游冯总讲述第一谛听交易细... 梦幻西游珍宝阁“第一谛听”流出团队一事引发广泛关注,部分粉丝质疑团队无人接手。随着讨论不断升温,团队...
警惕!个别致癌物超标!这种一次... 近些年,可降解一次性杯子由于环保、洁净的理念,呈现出快速增长的消费趋势。但有消费者反映,市场上一次性...
隆泰迪取得高速激光熔覆设备专利... 国家知识产权局信息显示,沧州隆泰迪管道科技有限公司取得一项名为“一种高速激光熔覆设备”的专利,授权公...
梦幻西游全服第一16技能谛听成... 自梦幻西游大佬高总宣布暂别赛场后,其手下的两只神兽去向便备受关注。据悉,高总那只全服独一无二的16技...
《失落星船:马拉松》试玩报告:... “欢迎来到天仓五Ⅳ。” 时隔大半年,我再次见到了《失落星船:马拉松》。 我在前几日有幸前往线下,参加...