来源:联合早报网
作者:陶瑞(国际科技顾问、时评人)
编辑:邓思涵
人工智能(AI)产品DeepSeek横空出世,在全球科技界引发巨大震动。发布不久后,美国总统特朗普公开表示,这应当成为美国产业界的“警钟”。
DeepSeek的成功毋庸置疑,但仅是优化整合而非原创突破,尤其是它以相对较低的成本实现重大突破。公司声称模型的开发成本仅约550万美元。虽然这一数字在业界引发广泛质疑,但无论外界如何争论,DeepSeek作为一款高性价比的产品,依然不容忽视。相比研发成本,更关键的是运营成本——即模型运行时消耗的算力资源。在这一点上,DeepSeek同样表现出色。
DeepSeek是如何做到“物美价廉”的呢?这得益于它采用的更加节能且高效的模型架构,例如专家混合模型(MoE)和多层注意力机制(MLA)。这些技术能够在提升计算效率、降低能耗的同时,增强信息处理能力。然而,这些技术并非DeepSeek的原创,而是业界的已有成果。DeepSeek的创新之处在于,它成功将这些算法进行集成和应用优化,最终提升性能,远超同类产品。
此外,也有传言称DeepSeek采用了“蒸馏”技术,利用OpenAI训练自己的模型。“蒸馏”是一种常见的技术手段,指的是在训练过程中,将问题输入给OpenAI,通过获取OpenAI的答案来进一步优化自身模型,类似一种“对答案”的过程。是否可以将这种做法视为盗用OpenAI的知识产权,至今难以定论。毕竟,外界无法直接接触OpenAI的内部代码和推理过程,只能看到输出结果,而AI的输出本身并不享有版权。讽刺的是,OpenAI本身也一直面临涉嫌非法使用他人版权内容,来训练自身模型的指控。因此,若简单将DeepSeek的成功归结为剽窃,显然不公平。
从更宏观的角度来看,DeepSeek的成功并非典型的“0到1”式的创新,而是通过“站在巨人肩膀上”取得的显著成就。尽管底层技术并非原创,但在集成和优化方面的突破,依旧代表中国在科技创新上的重要进步。
DeepSeek的成功让许多中国人倍感自豪,然而我认为,应当从这次逆袭中看到存在的诸多问题。DeepSeek的成功实属不易。这家由量化投资业务转型而来的初创公司,曾尝试融资,但公开资料显示融资之路并不顺畅。背后有多方面原因,主要是风险投资市场近年来急剧萎缩,于是投资者开始更倾向于短期回报快的项目,而非须要长期研发投入的创新型企业。DeepSeek长期依靠先前的资本积累得以维持运营。然而,市场上一定还有许多极具潜力的项目,却因缺乏资金支持而难以面世。
虽然私募风投市场急剧萎缩,但作为重点扶持产业,AI领域并不缺乏政府资源投入。许多知名企业以AI研发为名,获得巨额政府补贴。然而事实证明,大部分补贴项目并未取得理想回报,反倒是DeepSeek这样之前名不见经传的初创企业实现突破。这一现象应当引起深思。
科技创新是心急吃不了热豆腐的。越是急功近利,越是一无所获,创新需要的不是充满竞争压力的竞技场。DeepSeek之所以成功,其中一个秘诀就是它像一个自由科研的实验室,而非一个以业绩考核为主、压力巨大的商业场所。DeepSeek为工程师提供一个宽松、自由、舒适的工作环境,这与现代心理学对创新环境的研究高度契合。美国作为创新大国,并非依赖政府补贴,而是学术机构和成熟的商业市场愿意资助科学家自由探索。创新往往在意想不到的角落出现,因为从0到1的突破总是难以预测的。尽管DeepSeek已经取得一些进展,但仍未完全实现0到1的创新,因此,在科技创新道路上还有很长的路要走。
谁能真正引领“0到1”的创新,谁就能在科技竞争中立于不败之地。历史已经多次证明,真正的创新往往来自意想不到的领域,而这本质上是一个概率问题。关键在于是否能够转变思维定势,构建更加自由开放的科研环境,让市场在产业资源和资本分配中发挥更大作用。