就在我们欢天喜地过春节之时,国内一款 DeepSeek 的软件给了国外一个巨大的冲击,冲上了海外与国内免费软件排行榜榜首,席卷全球,不仅类如英伟达在内的美国科技股价大幅下跌,甚至引发了国家级的美国特朗普、日本政府等关注。
为什么DeepSeek突然爆火呢?是因为就是这么一个“名不经传”的中国小企业打造的大数据模型,但是却在自然语言推理等任务上的性能,可以比肩OpenAI o1模型正式版,关键成本相比之下要低不少,简单来说,对比OpenAI旗下的大模型,DeepSeek有着更低训练以及低使用成本与开源的优势。
有别于OpenAI“海量数据投喂”的训练方式,DeepSeek是先将数据进行分类总结,然后选择性输送给大模型,从而提高训练效率以及降低使用成本。
而面对着“一鸣惊人”来势汹汹的DeepSeek,OpenAI今天正式发布了最新、成本更低o3-mini 模型,并首次向免费用户开放推理模型,并且OpenAI的奥特曼表示,未来几周,满血版o3即将上线。
对于DeepSeek,OpenAI CEO奥特曼表示“DeepSeek确实是一个非常好的模型,OpenAI会开发出更好的模型,但不会像往年那样保持那么大的优势了”。同时奥特曼表示“在开源上站在了历史的错误一方,内部正在考虑开源策略”。
该说不说,DeepSeek的火爆给了OpenAI一定的压力,而良性竞争下催生出新的成果,对于消费者以及整个行业的都是一件好事情。