近期,DeepSeek通过“更聪明”的算法,在实现高性能的同时,却可以消耗更少的算力,训练成本更低,为人工智能发展提供了另一种范式,受到广泛关注。
无论是模型的训练还是推理,都需要算力平台作为基础。
科大讯飞近日发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1,同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级。
自讯飞星火大模型首次亮相至今,一年半多的时间内经历了九次升级,几乎每两三个月就会迎来一次升级。
无论是DeepSeek备受关注的锐意突破,还是科大讯飞持续迭代升级,都更具说服力地展现了源头技术自主可控既可能且可行的底气。
深度推理大模型来了
自去年OpenAI发布o1深度推理模型后,推理大模型正成为行业新的竞争方向。国内已有不少企业陆续发布了类似模型,尤其是中国AI初创企业深度求索发布的最新开源模型DeepSeek-R1,引发全球关注。
不过,全国产算力平台上的深度推理大模型仍处于“无人区”。
破局已现。1月15日,科大讯飞称,其携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力的具备深度思考和推理能力的大模型——讯飞星火X1。
什么是推理大模型?简单理解,AI会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。
目前一些通用大模型通过大量知识和数据的训练,让AI拥有快速直觉、无意识且快速反应的能力,但总会让人觉得回答质量不够稳定、能力不够强,似乎并不能“真正理解提问”。但推理大模型更具有意识、逻辑,会在回答之前进行一段时间的“思考”,提供更全面的解答。
举个最简单的例子,用讯飞星火X1解答高考数学题等复杂题目,讯飞星火X1不仅可以准确给出题目的答案,还能对解题思路和步骤进行详细拆解,有全面的思考、分析和推理过程。
由此也看出深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。
也正因为深度推理模型更接近人类的“慢思考”方式,相较于通用大模型,在某些领域,深度推理大模型能用更少的算力取得同等的效果。
此外,讯飞星火4.0 Turbo底座能力也再次迎来全新升级,七大核心能力全面提升,全面对标OpenAI最新版的GPT-4o。这也是讯飞星火从发布至今的第九次升级。
此次升级最重要的特点,便是针对行业、企业的痛点问题,在数学、行业知识、图文识别、长文本等能力上实现提升。基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好帮助用户。
大模型“标王”
人工智能的光明前景毋庸置疑。但大模型要想进一步成为生产力的变革工具,就必须与各行各业的场景相结合并落地应用,用实际效果说话。
大模型发展,应用才是硬道理。据悉,讯飞星火X1率先在教育等真实场景中实现了应用落地。目前,讯飞星火X1已在多地试点,在一题多解、教学知识关联、拓展学生高阶思维等方面赢得好评。
医疗领域,讯飞星火X1的模型策略也已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。科大讯飞称,将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。
另一方面,随着国内大模型领域的竞争更趋激烈,市场无力承担无止境的“烧钱”,相关公司也必须对大模型的商业落地效果进行考量,看是否能满足用户需求、产生价值增益。
得技术者强,得产业者胜。
2024年度大模型中标项目的“标王”也同样被科大讯飞拿下。某第三方机构公布的数据显示,在2024年的大模型招投标全年总盘上,科大讯飞的中标数量(91个中标项目)和中标金额(84780.8万元)均居第一。此外,科大讯飞还超过了第二名到第六名的中标金额之和。
从中标项目看,在科大讯飞的91个中标项目中,涵盖了通信、金融、能源、政务、医疗等多个行业,主要以央国企客户为主。
“标王”背后,不仅是技术支撑,更需要对不同行业的深度理解。基于“技术+应用”的不断正向循环,讯飞星火4.0 Turbo的行业能力全面提升,金融、油气、能源、电力、钢铁、航司等领域综合能力的绝对提升全部超过10%。
为帮助各行各业更好地落地大模型,科大讯飞以“通专结合、端云联动、软硬一体”的方式助力更多企业完成数智化升级,构建了从“建算力、理数据、训模型”,到“落场景、保安全、精运营”的全套解决方案。
数据显示,截至去年底,科大讯飞已经与中国石油、中国移动、中国海油等央国企及20多个行业的头部企业一起发布行业大模型,覆盖300多个应用场景。
全国产化算力“闯关”
在硬件资源有限的情况下,DeepSeek通过“更聪明”的算法,消耗更少算力实现更好性能。但也要看到,算力资源也的确面临着缺乏国产化方案的现实难题,与此同时,自主可控的需求也需要国产算力作为硬支撑。
开源证券研报指出,DeepSeek推出后,自主可控情绪有望继续得到催化;此外,由于DeepSeek开源和低成本特性,国产显卡用于推理的性价比急剧上升,因此中国算力自主可控的逻辑闭环逐渐形成,国产算力产业链发展将大幅加速。
作为中国人工智能“国家队”,科大讯飞为实现大模型领域完全的国产化,与华为携手自研算力底座,并于2023年10月24日联合发布了国内首个全国产算力平台“飞星一号”,常态化支持万亿参数的大模型训练。
去年10月24日,科大讯飞还与华为、合肥市大数据资产运营有限公司联合打造国产超大规模智算平台“飞星二号”,将实现新模型新算法的持续适配和智算集群规模的再次跃迁。
百舸争流之中,科大讯飞基于“飞星一号”打造的星火深度推理模型X1,成为当前全国产算力平台上唯一推理大模型,意义十分重大。这不仅是对全国产算力的可靠性验证,更是对自主可控的AI科技底座能力的可行性确认。
不可否认的是,目前国产算力在单卡、集群、生态上都和国际领先水平有一定差距。
“假如我们现在不是用国产平台,而是用已经成型的国外平台,今天星火大模型的效果可能会更好。但这一步你非走不可,除非你不想自立自强。”科大讯飞董事长刘庆峰说。
针对DeepSeek的创新技术,近日,科大讯飞还在深交所投资者互动平台上称,将持续推动算法迭代,让星火大模型在自主可控的算力平台上持续进化提升。
科大讯飞是安徽人工智能产业发展的生动缩影。近年来,安徽抢抓通用人工智能发展机遇,系统推进大模型、大算力、大应用,强化人才、基金、数据等要素供给。去年11月赛迪顾问发布的《中国人工智能区域竞争力研究》显示,安徽人工智能产业发展评价2023年排名全国第6位。
“2025年,我们比以往任何时候都更有信心!”刘庆峰表示,在通用人工智能发展的新阶段,科大讯飞将聚焦自主可控的底座能力和重点应用赛道,以长期主义精神保持战略定力。
(记者 许昊杰 通讯员 许可亮)