讯飞星火整体已超越ChatGPT,刘庆峰:国产大模型要走出自己的路
红星新闻
2023-10-25 16:41:13
0

原标题:讯飞星火整体已超越ChatGPT,刘庆峰:国产大模型要走出自己的路

10月24日,科大讯飞(002230.SZ)推出的大模型讯飞星火V3.0如约而至。

讯飞星火V1.0于今年5月6日正式发布时,科大讯飞曾提出要在“10月底整体赶超ChatGPT”。

经历两次迭代,讯飞星火大模型先后突破开放式问答、代码能力,并升级了多轮对话能力、多模态交互能力,此次推出的讯飞星火V3.0也像当初承诺的一样,实现了整体超越ChatGPT。

根据第三方测评,讯飞星火V3.0的综合能力已超越ChatGPT,达到国内领先、国际一流水平,尤其是在医疗、法律、教育行业的表现格外突出。

不仅如此,科大讯飞的董事长刘庆峰喊出了新一步的目标——明年上半年对标ChatGPT-4!

随着多家企业推出通用大模型,当前大模型行业已进入全新的阶段——拼落地应用,各大模型正在应用落地领域掀起一场全新的“百模大战”。

而作为大模型第一梯队的“国家队”选手,讯飞星火V3.0在经历两次迭代后,其重心已渐渐落在行业应用中,此次,科大讯飞联合不同行业的龙头企业共同发布了12个行业大模型,如工业、科研、金融、汽车、运营商和住建等领域,深入到各大行业中。

讯飞星火V3.0如约而来 达成目标“整体赶超ChatGPT”

10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞正式推出了讯飞星火V3.0。

红星资本局注意到,讯飞星火早前的版本曾被麻省理工科技商业评论誉为“中国最聪明的大模型”,而此次讯飞星火V3.0的七大能力持续提升,尤其是在数学能力和代码能力等上有了明显的“进化”。

以数学能力为例,讯飞星火V3.0已具备自动提炼规律的能力,它能通过观察新算式、小样本学习发现其中规律,并运用到全新的算式中进行计算。

比如,给讯飞星火V3.0提供两个算式及示范:a△b=(a+b)+ab+(a-b)+a+b、a&b=(a-b)+ab+(a-b)+a+b,再向它提问“(2△3)&3等于多少”,它能准确给出答案。

从数学能力到逻辑推理,再从代码能力到多模态能力,单项能力的不断突破也让讯飞星火V3.0全新升级,带来了诸多新功能,其中最亮眼的功能或为虚拟人格功能。

科大讯飞的董事长刘庆峰称,目前,讯飞星火V3.0的各类应用已有超过1200万用户,经过跟踪调研,他们发现:部分用户希望大模型不仅能回答问题,还要有个性。

讯飞星火V3.0做到了这一点,用户可以通过“友伴”从性格、情绪、表达风格等方面设定AI助手的基本人设,且可以导入特定的知识、相关对话记录形成个性化的记忆。

图说:与拥有哪吒人设的AI助手进行对话

这些点点滴滴的进步汇聚在一起,让讯飞星火V3.0真正拥有了和ChatGPT抗衡的能力。

国务院发展研究中心国研经济研究院的测评报告显示,星火大模型V3.0的综合能力超越ChatGPT,已达到国内领先、国际一流水平,在医疗、法律、教育行业的表现格外突出。

据刘庆峰介绍,科大讯飞根据《通用认知智能大模型评测体系》构建测试集,采用盲测进行测试,结果显示:讯飞星火V3.0的中文能力客观评测已超越ChatGPT。

另根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标ChatGPT48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。

以大模型解放生产力 首先在科研和工业上造福人类

事实上,随着多家企业推出通用大模型,大模型行业已进入全新的阶段——拼落地应用。

不同的行业有不同的需求和应用场景,当通用大模型能够适应这些行业的特点并进行具体的优化和调整,提高该行业的业务效率、切实创造经济价值,这才是大模型的关键竞争力。

讯飞星火是其中的佼佼者,刘庆峰就认为,“大模型首先要能够在工业和科研领域造福人类,这才是我们真正解决社会刚需的地方。”

据了解,在工业领域中,9月20日,基于讯飞星火和羚羊工业互联网平台的羚羊工业大模型已正式发布,通用人工智能正在成为新型工业化的核心引擎。

公开资料显示,羚羊工业互联网平台是在工信部指导下建立的国家级“双跨”平台,致力于用工业感知、工业认知、工业大模型推动制造业智能化转型。

而羚羊工业大模型具有文本生成、理解计算、知识问答和代码生产等能力,比如,该大模型可以通过非接触“听”声来智能判断设备的异常点,能把检测时间从3小时缩短至10分钟。

据刘庆峰介绍,在羚羊工业大模型发布后,从9月20日到10月23日,该平台的用户总量提升了59%至68.7万,服务企业次数提升了88%至370.6万次。

同时,在科研领域,讯飞星火V3.0与中科院文献情报中心联合打造科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能。

科大讯飞研究院院长刘聪在论坛上进行实测,通过科技文献大模型将十几份量子计算相关的论文一键生成综述报告,为科研人员快速了解某领域的最新论文大幅提效。

有测试数据显示,在使用了科技文献大模型后,学者的成果调研效率提高超过10倍,论文研读有效率和学术写作采纳率均超90%。

“假如能让350万正在高校读书的研究生和博士生把他们在调研、写作等过程中花的时间和精力减少20%-30%,这将极大释放中国未来的创造力和想象力。”刘庆峰说。

不仅仅是工业和科研领域,刘庆峰强调称,“在大模型时代,我们要跟各个行业更深度地对接。”

红星资本局获悉,科大讯飞此次还联合不同行业的龙头企业,共同发布了12个行业大模型,涉及金融、汽车、运营商、住建、物业、法律、传媒和水利等行业。

与伙伴共建产业生态 明年上半年能对标ChatGPT-4能力

在讯飞星火快速迭代的背后,是自主创新的算力底座。

刘庆峰回忆称,今年年初,他们曾经很担心讯飞星火项目,怕技术和算力赶不上国际水平,但在和华为沟通后,双方加强了战略合作,华为甚至派出“特战队”与他们一起熬夜加班。

在过去半年的时间内,通过孵化大模型融合算子、多维度分布式并行、算网存系统级的智能运维、基于CANN的联合深度优化,科大讯飞和华为“特战队”共同实现了讯飞星火大模型的训练和推理效率翻番。

华为的轮值董事长徐直军也出席了此次论坛,他称,他很高兴看到双方团队的精诚合作,并透露华为目前在全球使用的智能终端语音技术都来自科大讯飞,而且不仅仅是中文,涉及几十种语言。

在论坛上,科大讯飞还联合华为重磅发布基于昇腾生态的“飞星一号”大模型算力平台。

同时,刘庆峰宣布,对标ChatGPT-4的更大参数规模的星火大模型训练正式启动,力求在2024年上半年达到这一目标。“国内的大模型和ChatGPT-4比还是有差距,我们必须正视差距。大模型赋能千行百业是一场硬仗,只有实事求是的科学精神才能真正超越ChatGPT-4。”

“大模型时代的序幕刚刚拉开。”刘庆峰认为,当前不应只是简单的技术对标,“我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。”

事实上,讯飞星火大模型已带动相关产业生态的发展。自5月6日至今,讯飞开放平台新增143万开发者团队,同比增长331%,其中新增大模型开发者17.8万。

未来,随着技术不断进步,相关产业的生态逐渐繁荣,讯飞星火赶超ChatGPT-4的同时或能走出真正属于国产大模型自己的方向和道路。

唐浩

相关内容

热门资讯

广州澳捷取得显卡升降支架专利,... 金融界2025年3月18日消息,国家知识产权局信息显示,广州澳捷科技有限公司取得一项名为“显卡升降支...
如何在卧室有效安装和配置第二台... 在卧室安装和配置第二台路由器是扩展家庭网络覆盖、提升信号强度的有效方法,尤其适用于主路由器信号无法完...
新好游(超凡大厅房卡链接怎么弄... HfHt虽然距离传感器的位置改变,不过对于iPhone15系列手机来说灵动岛几乎没有变化,这种调整对...
让我来给大家科普新众乐房卡购买... 让我来给大家科普新众乐房卡购买渠道新鸿运斗牛房卡怎么卖是一款非常受欢迎的游戏,咨询房/卡添加微信:4...
海象大厅房卡联系方式道游大厅怎... 海象大厅房卡联系方式道游大厅怎么买房卡海米大厅牛牛房卡怎么卖要素一(KK)大厅介绍/房卡微/4743...
人海大厅新大圣金花房卡购买联系... 人海大厅新大圣金花房卡购买联系方式详细房卡怎么充值教程 无需点开直接加微【474330444】援引自...
新道游大厅房卡青鸟大厅金花房卡... vy苹果手机目前发展的情况并不是特别好,一方面是有消息称iOS16可能不会带来特别多的改变,另一方面...
518互游房卡购买新悠悠大厅怎... 518互游房卡购买新悠悠大厅怎么买房卡(砖石大厅房卡哪里买的)(今日/知乎)无需打开直接搜索微信【4...
实测分享牛牛卖房卡多少钱一张,... Qn4并且,据悉该机内置了5560mAh电池和150W超级闪充技术,同时最高内置了18G运存。另外,...
人海大厅新天道大厅怎么买房卡新... 人海大厅新天道大厅怎么买房卡新悠悠房卡【无需打开直接搜索微信;【474330444】 操作使用教程:...
玩家实测牛牛房卡批发价格,斗牛... GkA4H7C从核心配置来看,这款OPPO Reno10新机将搭载高通骁龙7+gen2旗舰级处理器,...
带你了解天九房卡链接微信王大厅... 2yEzyl3.全系电池大提升,其中标准版iPhone 14版本电池容量将会扩充为3228mAh,续...
分享干货新蜜瓜大厅拼三张怎么开... 分享干货新蜜瓜大厅拼三张怎么开挂时光互娱金花平台房卡怎么购买(今日/知乎)无需打开直接搜索微信【47...
工业和信息化部发文指导建设数字... 新华社北京3月18日电(记者张晓洁、张辛欣)记者18日获悉,工业和信息化部近日印发《工业企业和园区数...
推荐一款金花房卡购买联系方式,... XkL从核心配置来看,这款OPPO Reno10新机将搭载高通骁龙7+gen2旗舰级处理器,采用了更...
原创 【... (一)智慧医院启新程,科技赋能中医新体验 在人工智能与大模型技术蓬勃发展的浪潮中,北京中医药大学东方...
推荐一款正版房卡批发,金花房卡... uJvsVph而且有消息称iPhone14系列中的标准版和新增的Max版本都将搭载A15处理器,又或...
推荐一款正规房卡链接在哪购买,... 1从核心配置来看,这款OPPO Reno9手机搭载了高通骁龙778G处理器,采用了更先进的6nm工艺...
蛮王大厅房卡新大圣大厅怎么买房... 蛮王大厅房卡新大圣大厅怎么买房卡(新九方金花在哪买房卡)加:微(474330444)炸 金 花链接房...
玩家实测牛牛房卡哪家便宜,牛牛... uZwyAY在核心硬件方面,据悉这款摩托罗拉X50mini采用了高通骁龙7+ Gen2移动平台,高通...