划重点:
1、DeepSeek极大降低了推理的成本,成本比GPT低,但比通义千问、豆包等国内大模型还是要贵一点。
2、DeepSeek不是“包治百病”,厂商除了DeepSeek也会接入其他厂商的模型,应用于不同的场景,比如在涉及到语音交互的场景,用语音模型会更好。
3、DeepSeek R1给大家提供了一个文理兼备、类似于985大学毕业的本科生。接下来的关键是,如何能把它培养成一名优秀的老师。
4、长期以来,头部的教育公司加起来的市场份额可能不到5%,DeepSeek的出现,可能让头部教育公司市场份额能占50%以上。
5、DeepSeek最大的意义在于让AI出圈了,FoloToy玩具的销量,在DeepSeek爆火之后增长了百分之几十。
出品|搜狐科技
作者|张雅婷
犹如一阵呼啸而来的飓风,DeepSeek对各行各业的发展正产生着深刻的影响。
无论是微信、百度搜索等应用软件,还是手机、汽车、PC等终端硬件,都在纷纷接入DeepSeek。
不过令外界好奇的是,企业纷纷接入DeepSeek究竟是蹭热点还是真有用?与其他国产大模型相比,DeepSeek真是全方位领先吗?在落地应用中,DeepSeek还有哪些缺陷?
2月25日,搜狐科技邀请到了星纪魅族副总裁王炼、学而思九章大模型负责人白锦峰、FoloToy产品合伙人孔淼邈,对DeepSeek在产业界的落地应用情况,进行了深入探讨。
据三位嘉宾透露,DeepSeek的逻辑推理能力有了明显提高,在智能化、拟人化方面进步明显。不过,DeepSeek也并不是万能的,相关突破主要来自文本模态,多模态的世界模型并没有明显进步。此外尽管DeepSeek的费用比GPT低,但也要高于国内其他大模型,比如通义千问、豆包等。
DeepSeek能答奥数题,但也不是“包治百病”
谈及DeepSeek的表现,多位嘉宾对它的逻辑推理能力都表示了认可,这在行业应用上可以体现为解题能力的提升、应用交互更加逼真等等。
星纪魅族副总裁王炼表示,在手机行业,接入DeepSeek主要体现在智能化水平,以及拟人化方面会变得比较好。比如,智能体里面有非常逻辑清晰的推理过程,这也是增加了用户的粘性。
不过,他也认为DeepSeek不是包治百病。星纪魅族除了接入DeepSeek,也接了比如阿里等其他厂商的模型。“要把不同的模型用于不同的场景去使用,比如在涉及到语音交互的场景,用语音模型会更好。”
学而思九章大模型负责人白锦峰透露称,对于教育领域来说,DeepSeek R1的模型给大家提供了一个文理兼备的,类似于985毕业的本科生。
“学而思对解题的指标是非常敏感的,每个月甚至每周定期会摸底各个产品,DeepSeek R1在数学的解题能力方面得到了极大的提升,之前的模型做得没有那么的好。”
不过,DeepSeek缺点是不能很好区分用户到底是几年级的,经常会用高中或者初中解复杂方程的方式,去教小孩的部分题目。“技术的提升确实是非常的明显,但是离真正解决用户问题还有一些距离。”
他提到DeepSeek幻觉率高的问题,并表示主要因为在大规模预训练和后续做强推理过程中,没有做良好的平衡,从技术层面很快就会得到解决。“推理能力强就是逻辑非常的自洽,相当于说啥都能给你编一套非常好的故事,但故事如果跟事实不符的话,就会幻觉率高。”
FoloToy产品合伙人孔淼邈认为,去年大模型的数学能力不太行,加减乘除都有概率会算错,而现在,DeepSeek的奥数题都能答得非常好了。但DeepSeek量起得太快,近期官方API的稳定性有一些差。
DeepSeek成本比GPT低,比国内大模型高
在训练、架构、算法等多个层面上的技术创新,让DeepSeek形成了低成本、高性能的高性价比优势。
事实上,AI在应用落地上很大程度是受成本的影响。以手机行业为例,很多消费者使用AI功能频率不高的原因,也是因为很多企业不敢放量让大家使用。
白锦峰表示,DeepSeekR1大概的成本是OpenAI的大概3%左右,极大降低了推理的成本。“我在o1刚发布那时候充200美金,一共测了大概几百道题就没钱了,成本实在太高了。”
他指出,用R1测1000道题,也就大概几块钱的问题。o1里边原来不能大规模普及的任务,现在全民都可以使用。
与国内大模型相比,DeepSeek表现更好,但成本也依旧要高一些。
星纪魅族副总裁王炼表示,一直说DeepSeek的成本比较低,其实主要是比GPT的费用低,但是比国内的一些模型还是贵一些的。
“比如要是命中缓存的话,DeepSeek在输入侧,百万token不命中缓存大概是4块钱,输出大概是16块钱。同等输入的情况,阿里的通义千问大概是在5毛到5块之间。”
AI应用落地,还需要在多模态、成本等方面进行突破
DeepSeek推动了AI在各行各业的落地,正如阿里巴巴CEO张勇在演讲时曾说过,所有行业都值得基于人工智能技术重做一遍。
不过在本次直播中,相关行业嘉宾强调,要推动AI的更好落地,还需要AI在多模态、成本等方面有突破。
白锦峰认为,DeepSeekR1的突破,主要来自文本模态,多模态的世界模型并没有明显的突破。
他举例称,如果站在一个学生的视角来看的话,学生们遇到一些文本相关的难题,DeepSeek 解决得确实非常好。但是涉及到图形题的话,它就没有这个能力了。
“所以要完全解决学生的问题,以目前AI的发展水平来看,还是需要借助于传统方法,或者借助于垂直领域的攻坚。”
孔淼邈认为,现在AI落地最大的挑战还是成本问题。文本的token已经比较便宜了,百万token也就几块钱,但AI玩具涉及到语音交互,大模型声音识别、语音合成的费用为一万字几块钱,相当于前者的百倍。
“如果真的是想做普惠AI,想让每个人都有一个AI玩具,我理解成本上还是有比较大的挑战。”
王炼则表示,AI的落地还需要有爆发力的场景,手机AI修图、AI对话这些功能都很同质化,厂商需要更贴近用户,为用户解决高频痛点,星纪魅族觉得智能体这个方向可能会有所突破,但这需要AI有比较高准确率的推理能力。
他认为,目前的大模型,如果包装成智能体,做一个复杂的任务,准确率会很低。
比如说,让AI去爱奇艺帮忙找一个收视率排名前十的古装影片,里面可以拆解为很多个步骤,需要先打开爱奇艺、然后搜索排名、根据爱好筛选等,准确率要达到90%就是一个很高的要求。
此外,完善的AI生态也会推动AI应用落地。王炼举例说,星纪魅族目前已经打通了手机、AR眼镜和智能座舱,DeepSeek等大模型可以跨端应用,用户的使用习惯能够在各个端流转,AI会更了解用户意图,并精准帮助用户执行。这些新场景涌现出来,都会为AI应用带来新的增长点。
DeepSeek或重塑教育市场格局,推动手机、玩具等销量增长
DeepSeek这股飓风,也或将对各行各业的市场格局产生影响。
孔淼邈认为,DeepSeek最大的意义在于让AI出圈了,之前都是科技从业者关注,现在甚至家里的七大姑八大姨都在用它了;与此同时,FoloToy的AI玩具在DeepSeek爆火后也增长了百分之几十。
白锦峰表示,教育行业长期以来是一个极度分散的市场,头部企业市场份额连5%都到不了。DeepSeek的出现,可能会让头部企业市场份额占到50%以上。
甚至教育的模式也会随之改变。他认为未来5到10年之内,小孩的知识获取大概率都是通过大模型去获得,每一个孩子都有AI老师。
“但AI不会取代老师,大模型可以取代教师教研的任务,比如批改作业、做教案,老师就有更多的时间关注学生的个性发展,比如身心健康等等。”
在手机行业,AI手机的概念出现了一两年,已成为驱动创新和用户换机的关键因素之一。王炼认为,DeepSeek的出现,模型能力增长、成本的下降,有助于手机销量的提升。
他还表示,DeepSeek的出现也彰显了模型趋近于向特定的方向收敛,分别是语言模型、多模态模型、推理模型。DeepSeek也推动了手机AI智能化水平大幅度提高,成本的下降等等。“根据我们的监测,基本每14个月token的成本会降低几倍。”