今天分享的是:人工智能专题:DeepSeek十大关键问题解读
报告共计:22页
《DeepSeek十大关键问题解读——人工智能系列深度》由国海证券刘熹撰写,该报告围绕DeepSeek展开,深入探讨其在人工智能领域的多方面影响及发展趋势。DeepSeek探索出“算法创新 + 有限算力”的新路径,通过优化模型结构、训练方法和针对性GPU优化,降低了训练成本,其开源特性也降低了下游企业调用成本。在算力影响上,虽短期训练侧算力需求或受影响,但推理价格下降吸引更多用户,带动英伟达H100 GPU租赁价格提升,中长期推理算力需求有望持续增长;多模态模型因处理多种数据,对算力要求更高。芯片格局方面,英伟达在训练领域仍具计算与生态优势,DeepSeek提升了训练算力使用效率,或使英伟达高端芯片初期主要用于探索AGI,而推理芯片呈现国产化、ASIC化等趋势,DeepSeek也积极适配国产芯片 。DeepSeek系列模型凭借快速技术突破和开源特性引发轰动,其开源采用MIT协议,打破了部分封闭生态。关于模型发展方向,MoE架构在计算效率、AI响应速度、处理复杂任务和灵活性上优于传统稠密模型。蒸馏模型能减少大参数模型部署缺点,有利于本地部署和端侧发展。多模态技术从文本向更多模态扩展,众多厂商积极布局。在应用侧,DeepSeek有望加速AI应用普及,云端算力和部分模型厂商、应用厂商或将受益,且其支持“模型蒸馏”,有望加速AI在端侧的落地,带动端侧AI算力硬件需求增长。此外,北美互联网大厂增加资本开支用于服务器和数据中心,以发展模型预训练与推理,他们重视DeepSeek技术。
以下为报告节选内容