2025年伊始,幻方量化旗下AI初创公司DeepSeek成功“破圈”,凭借基于深度学习的量化交易模型“掀翻”了全球人工智能市场的牌桌。如果以OpenAI为代表的大语言模型进一步催化了具身智能的发展,那么DeepSeek的出现,证明了在“大力出奇迹”的规模定律(Scaling Law)之外,AI大模型还有另一条制胜之道:调整大模型的基础结构+有效利用有限资源。
美国OpenAI创始成员之一的安德烈·卡帕西(Andrej Karpathy)表示:“DeepSeek在有限资源下展现了惊人的工程能力,它可能重新定义大模型研发的规则。”著名投资公司A16z创始人马克·安德森(Marc Andreessen)称赞这是“最令人惊叹的突破之一,给世界的一份意义深远的礼物”。
DeepSeek的横空出世,使得大洋彼岸的华尔街也受到了不小的震动。最先受到冲击的便是英伟达。美股时间1月27日收盘,英伟达公司股价下跌16.97%,市值一日内蒸发近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。其他半导体企业也受到波及,博通下跌17%,AMD下跌6%,微软下跌2.14%,纳斯达克综合指数跌去了3.1%,相当于损失超过1万亿美元。
有专家表示,相较于美国的OpenAI,DeepSeek才是真正的“OpenAI”。DeepSeek从创始之初坚持开源,V3、R1以及Janus-Pro等最新大模型均通过技术文档面向所有人公开。目前,已经有不少人通过公开技术路线,成功复现了DeepSeek的测试结果。DeepSeek采用MIT许可协议,完全开源,不限制商用,且无需申请,并且明确允许用户可以随时随地访问这一资源,让每个人都能平等获取知识与信息。比如,DeepSeek-V3不仅开源了模型权重,还支持本地部署。开发者可以根据自己的需求对模型进行定制和优化,甚至可以将其部署到自己的服务器上,完全掌控数据隐私。
相比之下,冠以“Open(开放)”为名的OpenAI反而走向了闭源道路,在GPT-3发布之后限制了对模型的访问权限,仅通过API提供服务,GPT-4同样隐藏了训练数据和模型权重,彻底闭源了。即便是GPT-2的开源也并非基于MIT许可协议,有相当多的限制。
DeepSeek证明,全球AI的后起者通过通过训练方法创新、数据质量提纯、架构轻量化,完全可以跳出“堆资源”的内卷陷阱。这种效率提升减少了算力浪费,相当于用滴灌代替了漫灌。自然也就破解了对算力“力大砖飞”的迷信。技术多元化正在冲击算力霸权,这也是市场供需结构演进的一种必然。
DeepSeek成功的背后是中国本土化人才的胜利!与很多科技公司偏向于挖美国科技巨头的人才不同,DeepSeek打造的人才队伍是完全本土化的,这是该公司的另一个独特之处。DeepSeek员工都来自中国顶尖学校,例如北大、清华和北航的博士,而不是来自美国机构的专家或者“海归人才”。创始人梁文峰的理念是必须自己培养顶尖人才,他本人获得了浙江大学电子信息工程本科和硕士学位。
谈到DeepSeek带来的震撼,美国财富管理公司Annex Wealth Management首席经济学家Brian Jacobsen表示,这可能意味着对芯片的需求减少,对为模型提供动力的大规模电力生产的需求减少,对大型数据中心的需求也减少。“DeepSeek可能正在颠覆过去两年推动市场发展的AI叙事。”
DeepSeek在全球范围获得的成功表明,中国AI技术已攀上新高峰,凭借顶尖性能、极致成本控制与强大产业带动力,成功在全球AI舞台中央站稳脚跟,改写国际竞争版图。中国AI必将乘风破浪,逐步缩小与美国差距,甚至实现弯道超车,以AI之力赋能人类美好生活,重塑全球科技经济新秩序。