登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座
和讯网
2023-11-16 12:43:46

原标题:登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座

登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座

近期,互联网公司及手机厂商接连发布自研大模型,权威榜单显示,国产大模型的各项性能再攀高峰。11月16日,记者在C-Eval和CMMLU两大权威评测榜单中发现,夸克大模型成为双榜第一,进一步展现国产大模型在数据精调及模型框架上的能力提升。

作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。

在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。

11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。

据悉,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。

领和讯Plus会员,免费看更多独家内容:8大财经栏目,最新最热资讯干货独家行情解读,快人一步掌握市场投资风向。

相关内容

热门资讯

怪猎物语3发售即翻车?仅48%... 今天咱们来聊一聊卡普空刚出炉的新作《怪物猎人物语3:命运双龙》,相信不少怪猎老粉今天都在蹲着点等解锁...
AI时代学术期刊如何守住“生命... 当人工智能不断深入各行各业,作为知识生产前沿阵地的学术期刊,将如何守住自己的“生命线”?3月13日,...
浪潮通用软件申请应用软件补丁动... 国家知识产权局信息显示,浪潮通用软件有限公司申请一项名为“一种应用软件补丁动态依赖管理方法、系统及计...
EA《战地风云6》将于3月17... IT之家 3 月 15 日消息,EA 宣布旗下《战地风云 6》将于 3 月 17 日至 24 日开启...
浙江培育一流创新生态 本报杭州3月14日讯(记者李景)记者从近期举行的浙江省建设一流创新生态打造最具竞争力营商环境大会上获...