国产大模型ChatGLM3发布:用华为芯片推理速度提升超3倍,多能力对标GPT-4V
钛媒体APP
2023-10-27 18:24:17
0

原标题:国产大模型ChatGLM3发布:用华为芯片推理速度提升超3倍,多能力对标GPT-4V

(图片来源:unsplash)

钛媒体App获悉,10月27日下午举行的中国计算机大会(CNCC2023)一场论坛上,阿里、腾讯投资的人工智能(AI)独角兽公司智谱 AI 正式发布全新自研的第三代基座大模型ChatGLM3系列。

新的ChatGLM3包括ChatGLM3-1.5B(15亿)、3B和6B参数三种,不仅在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升2-3倍。同时,基于集成自研AgentTuning技术,在智能规划和执行上比ChatGLM-2提升1000%。另外,ChatGLM3还利用华为昇腾生态,使算力推理速度提升3倍以上。

智谱 AI CEO张鹏表示,最新的自研模型ChatGLM3就是瞄准GPT-4V(多模态版的GPT-4)的跨模态能力,是ChatGLM全新一代的技术升级。

“对标OpenAI是智谱 AI 成立以来的目标。智谱 AI 致力于让机器像人一样思考,我们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式 AI‘第二阶段’。”张鹏称。

据悉,智谱 AI 成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准 AI 大模型研发落地,公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。

2020年,智谱AI 开始GLM预训练架构的研发,并训练了100亿参数模型GLM-10B;2021年利用MoE架构成功训练出万亿稀疏模型;2022年公布1300亿级超大规模预训练通用模型GLM-130B,并以此打造大模型平台及产品矩阵。

2023年,智谱AI 推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI 迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。

当前,智谱 AI 开源模型在全球下载量已超过1000万次。同时,该公司也进行商业化探索,打造AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。

融资方面,创立至今的四年多,智谱AI 共完成四轮融资。10月20日,智谱 AI 宣布年内累计融资额超过25亿元人民币,投资方包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。

截至目前,智谱 AI 公司估值已超过100亿元,是国内 AI 领域独角兽企业。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。

此次,智谱 AI 发布的最新ChatGLM3通用基座大模型,在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。

其中,性能方面,ChatGLM3-6B在44个中英文公开数据集测试中国内同尺寸模型排名首位,相比ChatGLM2-6B,多个排名提升33%以上,GSM8K基准提升179%;推理方面,相较于目前伯克利大学开源的vLLM,速度提升2-3倍,推理成本降低一倍。

同时,新的模型还集成自研AgentTuning技术,激活模型智能体能力,在智能规划和执行方面比ChatGLM2提升1000%,支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景,最新AgentBench基准测试上ChatGLM3-turbo和GPT-3.5接近;国产算力层面,以昇腾生态为例,ChatGLM3推理速度提升达3倍之多。

而在模型尺寸上,ChatGLM系列首次增加1.5B、3B这类小参数模型/张鹏称,主要原因是用户需求和算力成本之间的平衡,而且支持国产芯片的边缘侧模型ChatGLM3-1.5B可在笔记本电脑、手机、汽车等场景部署,速度达20 Tokens/s,精度上1.5B和3B模型与ChatGLM2-6B模型性能接近。

现场演示中,对标ChatGPT、基于ChatGLM3的 AI 聊天机器人平台“智谱清言”,如今不仅可以实现表格生成柱状图、折线图,而且还可以获得实时新闻搜索数据、看蔬菜写菜谱以及代码生成函数等能力。

然而,钛媒体App也发现,在比如“用代码画心形”这类问题上,智谱清言仍存在一定的输出错误等幻觉问题。

另外,在To B企业端方面,智谱AI 提供的 API 开放平台支持开放模型、专属模型、本地化私有模型部署方案,帮助企业去构建自主可控大模型。同时,ChatGLM3 开发平台从三种量级整合为ChatGLM3-turbo,只提供一个标准 API模型方案,整体价格降低50%。

“这(ChatGLM3模型价格)达到国内最低,甚至在全世界范围之内大模型 API 售价最低的水平线。”张鹏表示。

据钛媒体App了解,目前智谱 AI 公司主要销售三类技术产品:数字人SaaS/PaaS方案,科技情报SaaS/PaaS方案,以及包括ChatGLM系列在内的认知大模型PaaS/MaaS平台方案。

张鹏透露,目前智谱 AI GLM大模型已经应用于政务、金融、能源、制造、医疗等领域,支持华为昇腾、神威超算、海光DCU等10余种国产硬件生态,合作伙伴包括阿里、腾讯云、火山引擎、华为、美团、微软、OPPO、海天瑞声等数十家公司。

(本文首发钛媒体App,作者|林志佳)

相关内容

热门资讯

游戏推荐牛牛房卡批发价格,正规... jl而且根据最新消息显示苹果今年推出的iPhone15系列手机中其距离传感器将会位于灵动岛的区域内,...
游戏!正版房卡批发大厅,金花房... ZcH据外媒报道称,在 iPhone 14系列推出之前,苹果公司就已经开始了对 iPhone 15的...
游戏知识!斗牛房卡哪里买,牛牛... Fa关于iPhone 14系列新机的其他配置信息,这里也简单介绍一下。iPhone 14系列将会取消...
游戏金花房卡批发,金花房卡哪里... KPqiPhone16Pro这次的主要卖点,集中在屏幕上的体验和后置相机模组的设计,这两个设计可以说...
万林科技档案数字化元数据标准技... 在档案数字化的浪潮中,元数据作为连接物理档案与数字世界的桥梁,扮演着至关重要的角色。它不仅为数字档案...
科技改变生活:2025春季北京... 随着科技的迅猛发展,医疗行业正在经历一场深刻的变革。2025年04月25-27日在北京中国国际展览中...
深耕科学研究 加速成果转化 日前,福州大学化学学院学生吴一迪及其团队的项目“‘氢’新‘智’造——数据驱动低成本高效电解水催化剂的...
评测!牛卡批发价格,斗牛房卡批... SC5obgA关键是苹果手机一直都有着战三年的称号,再加上iOS系统也在逐渐变得给力,也就会导致产品...
游戏指南!牛牛卖房卡多少钱一张... qyNn88等到A16系列处理器采用增强版工艺之后,iPhone14系列的性能应该会和安卓手机的处理...
游戏指南!战神牛牛房卡批发价,... Et3d8在血雨腥风的手机市场,一款产品要想存活下来,就一定要有差异化的产品设计。摩托罗拉手机是一个...
游戏测评!微信牛牛房卡怎么建房... c300ZYGiPhone 14 Pro正面采用了居中感叹号形挖孔,内置True Depth摄像头模...
游戏测评!牛牛房卡批发,战神牛... uMwwUVPa据外媒报道称,在 iPhone 14系列推出之前,苹果公司就已经开始了对 iPhon...
游戏!牛牛房卡制作链接,金花房... DZAY毕竟有热度的消息,大家都愿意去挖。也有一些推特博主,也会爆料苹果的新机。所以新机还在孵化中,...
我做小红书兼职,年入40000... 之前跟大家分享了《》之后,有很多小伙伴来问,这些小红书兼职通过什么样的渠道找的? 怎样做才能接到小红...
游戏牛牛房卡制作链接,房卡批发... PP9FtM1.顶级的A16仿生芯片将运用到iPhone 14系列上。苹果A16芯片采用先进的4nm...
游戏推荐牛牛房卡哪家便宜,牛牛... ij4z而且根据最新消息显示苹果今年推出的iPhone15系列手机中其距离传感器将会位于灵动岛的区域...
游戏测评!牛牛房卡哪里有卖,微... Ba8b从核心配置来看,这款OPPO Reno10新机将搭载高通骁龙7+gen2旗舰级处理器,采用了...
游戏正规房卡出售平台,牛牛房卡... 2OJZP90g随着智能手机的发展,国产手机取得的进步是大家都有目共睹的,同时品质和体验的不断提升,...
重庆鼎鼎机电取得一种齿轮循环倒... 金融界2024年12月26日消息,国家知识产权局信息显示,重庆鼎鼎机电有限公司取得一项名为“一种齿轮...
注册卡可以注册抖音吗? 在当今信息化和数字化的时代,注册卡作为一种新型的通信工具,被广泛应用于各类平台的账号注册之中。注册卡...