DeepSeek有望激发 新一波人工智能创新浪潮
创始人
2025-02-08 19:21:23

中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及资本市场。业界人士认为,DeepSeek模型有望激发一波创新浪潮,推动全球AI继续进步。

据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。

国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。

高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。

英国金融时报》发表的一篇评论文章指出,DeepSeek挑战了人工智能产业在过去一段时间的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。

摩根士丹利认为,DeepSeek的模型表明,前沿AI能力可能不需要大量计算资源就能实现。通过巧妙的工程设计和高效的训练方法,高效利用资源可能比纯粹的计算能力更重要。这可能会激发一波创新浪潮,各家企业会探索具有成本效益的AI开发和部署方法。

DeepSeek的模型是开源共享的。近日,全球知名开源平台抱抱脸公司等多个团队已宣布复现了DeepSeek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上发文说,DeepSeek-R1的面世,意味着开源模型正在超越闭源模型。

英国《金融时报》的评论文章说,开源模型DeepSeek-R1对全球用户产生极大吸引力,有利于推动人工智能技术的开发和应用。文章说,对于大多数商业用户来说,拥有一款足够可靠并且好用的模型比拥有绝对领先的模型更重要。“并不是每个司机都需要一辆法拉利。像R1这样模型的推理能力进步,可能会为与客户互动或处理工作任务的‘智能体’带来突破性变化。”如果能以更低的成本拥有这些模型,企业的盈利能力将提升。

瑞士瑞银集团指出,如果AI训练和推理成本显著降低,预计更多终端用户将利用AI来改善他们的业务或开发新的用途。(记者 吴晓凌)

本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有。如因无法联系到作者侵犯到您的权益,请与本网站联系,我们将采取适当措施。

相关内容

热门资讯

《鬼武者:剑之道》游戏细节 武... 卡普空旗下备受期待动作新游《鬼武者:剑之道》即将于9月4日登陆PS5/XBOX Series X|S...
广州市政务人工智能中枢“穗智政... 南方日报讯 (记者/吴雨伦 通讯员/穗政数宣)7月4日,广州市政务和数据局召开穗智政·广州市政务人工...
原创 中... 2026年中国空间站将迎来特殊性的一年,多个历史性转折点要到来,有什么呢? 其最大的亮点无非就是很多...
靠谱大容量TF卡推荐:三星T7... Switch一代仍在发光发热,游戏阵容庞大、生态成熟,但32GB(OLED版64GB)的机身存储,早...
从ARD协议说起,Agent行... 文 | 新眸,作者 | 李小东 六月中旬的科技圈其实挺热闹的,OpenAI发新模型,Anthrop...