推理技术新突破!千问新模型多项性能破全球纪录
创始人
2026-01-27 18:24:32

来源:滚动播报

(来源:科创中国)

1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型通过总参数、强化学习、推理计算的规模扩展,刷新科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试的全球纪录,成为迄今为止最接近国际顶尖模型的国内AI大模型。

据介绍,在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。

同时,面向智能体Agent时代,Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能的结合工具进行思考的能力。此外,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,开发者可在QwenChat上体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API(应用程序接口)服务,普通用户也可通过千问PC端和网页端试用模型。据了解,千问APP也即将接入新模型,所有用户都可体验。

(来源:科技日报 作者:崔 爽)

相关内容

热门资讯

5亿强推,当一只“狗”站上资本... 谁能想到,2026 年开年顶流不是爱豆不是网红,而是《逆水寒》手游里一只血河小狗!5亿流量强推霸屏全...
我局组织参加北斗芯片与终端企业... 为进一步推进全省北斗产业创新发展,推动芯片企业和终端应用深度对接,1月26日,省工信厅在常州举办了“...
马化腾年会透露,已退出“外卖大... 1月26日下午,腾讯召开2025年度员工大会。据新华网、快科技等消息,腾讯公司董事会主席兼首席执行官...
“数字泔水”泛滥,政协委员建议... 随着人工智能时代的到来,大量AI生成的虚假消息充斥在朋友圈中,深度伪造技术带来的假照片、假视频正在影...
马年新时装全解析!穿上这身,新... 各位少侠,这个春节,咱们玩家在倩女端游里算是彻底被“宠”明白了!前几天的“新春减负”直接把春节期间游...