我国首部大模型国标落地 完成华为盘古、讯飞星火等模型场景验证
创始人
2025-12-27 17:01:42

来源:市场资讯

(来源:快科技)

快科技12月27日消息,据中国国家市场监管总局消息公布,近日,《人工智能大模型》系列国家标准正式实施。

作为首部聚焦通用大模型的国家标准,该系列填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会认可。

基于此构建的"求索"-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的"能力标尺"。评测体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中国石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中国移动"九天"等模型的场景验证。

截至目前,标准工具完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成"研发—评测—应用—升级"闭环。

值得一提的是,标准国际化也同步推进。面向东盟编制英语、老挝语、高棉语版本,填补了区域空白;中国开源模型架构已被新加坡等国项目采用。

相关内容

热门资讯

运营了17年的MMO,把新手村... 用不一样的方式讲故事。 文/青晖 《剑网3》里有个地方叫稻香村,是个新手村,每个玩家进入江湖的第一站...
原创 L... LOL选手比赛中发生重大失误,赛后连连道歉,发誓自己没有打假赛,这波操作,说实话,用“离谱”形容都不...
原创 梦... 梦幻西游2026春心萌动活动已于昨日12点开启全服投票,仅一天时间,男榜便呈现“神仙打架”的激烈态势...
《沙罗周期》评测9.2分:怒海... “硬核玩法设计教科书” 《沙罗周期》是Housemarque在《死亡回归》问世6载后,推出的又一款“...
原创 哪... 大家好我是指尖,哪吒的新皮肤已经全面曝光,不知道大家看过之后的感受如何,我只能说吸引力拉满了,想必很...