智谱AI新大模型来袭：部署价格大降50%，免费商用，做应用能力逼近GPT3.5

智谱AI新大模型来袭：部署价格大降50%，免费商用，做应用能力逼近GPT3.5 | 最前线

36氪

2023-10-28 14:02:02

0次

文｜周鑫雨

编辑｜邓咏仪

2023年10月26日开幕的中国计算机大会（CNCC）上，最受瞩目的仍然是大模型。

这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果，他们更是为了秀出各家厂商的大模型“肌肉”，展示产业落地的成功：

这也意味着，如今落地成果代替技术参数，成了大模型厂商最重要的竞争力。

10月27日，作为AI赛道备受瞩目的独角兽，智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时，能容纳500多人的报告厅就几乎坐满了观众。

△在CNCC，智谱AI CEO张鹏发布新一代模型

在论坛上，智谱AI发布了新一代的中英双语对话模型ChatGLM3和生成式AI助手智谱清言，并在智谱AI开放平台上推出了新的模型训练和部署方案。据智谱AI CEO张鹏介绍：

ChatGLM3-turbo版本，也就是企业级部署版本，在最新AgentBench上测试后，其Agent能力已经接近GPT-3.5，不过与GPT-4还存在明显差距。

△在最新AgentBench上，ChatGLM3-turbo版本的Agent能力

智谱AI的下半年可谓好事连连：

8月31日，在8家首批获网信办批准向公众提供大模型产品服务的公司中，智谱AI占有一席。其研发的千亿参数对话模型“智谱清言”顺势面向公众开放；

在近几个月完成的B-4轮融资中，智谱AI的股东出现了腾讯战投、阿里云战投等头部互联网战投和基金的名字。2023年，智谱AI已经累计获得超25亿人民币融资，一跃成为AI赛道的独角兽。

如今的智谱AI的核心团队，除了首席科学家唐杰、CEO张鹏等清华知识工程实验室出身的创始人，还迎来了新面孔——智源研究院副院长刘江，曾经光年之外（王慧文创立的AI公司）的核心成员，如今首次以“智谱首席生态官”的角色出席CNCC。

新一代ChatGLM3发布，特定任务下接近GPT-3.5水平

论坛上，智谱AI对标GPT-4V发布了新一代的对话模型ChatGLM3，并推出了1.5B、3B、6B规模参数的不同版本。相较于ChatGLM2新增的1.5B版本，已经能够部署在笔记本电脑、手机和汽车上。

CEO张鹏介绍，ChatGLM3主要在4四个方面进行了性能提升：

接入了具有多模态理解能力的模型CogVLM，提升看图识语义能力。

接入了代码增强模块 Code Interpreter，能根据用户需求生成代码并执行，自动完成数据分析、文件处理等复杂任务。

接入了网络搜索增强模型WebGLM，进行了联网。

增强了语义理解和逻辑理解能力。

值得一提的是，如今AI Agent（智能体）已经成为构建AI原生应用的新风向。为此，ChatGLM3集成了智谱AI自研的AgentTuning技术。

如何理解这项技术？就像义务教育和专科教育之间的关系，对于大模型而言，通用性和特定场景下的能力往往成反比：通用性强的大模型构建的Agent，执行特性任务的能力反而会变弱。

AgentTuning技术的关键点在于构建了一个轻量但高质的指令调整数据集。通过这一指令调整数据集，大模型可以在增强对特定任务的代理能力的同时，还不影响其通用性，这也为用户构建高性能Agent提供了一个解法。

智谱AI提出的AgentBench，是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍：ChatGLM3-turbo版本，也就是企业级部署版本，在最新AgentBench上测试后，其Agent能力已经接近GPT-3.5，不过与GPT-4还存在明显差距。

“大模型元年”，在开场演讲上，智谱AI首席科学家、清华大学计算机系教授唐杰如此戏称今年的“百模大战”。

他表示，今年预训练模型真正的创新型的学术研究少了，而基于一个强大底座疯狂训练模型的人变多了，只需要加个名字，就成了新的模型。

那么，智谱AI如何理解创新型的学术研究？

此前在36氪的专访中，张鹏就表示“智谱AI不做中国的OpenAI”。在他看来，中国没有自己的预训练模型框架，市面上最主流的三种模型训练路径（GPT、BERT、T5）都来自西方。

为了打破西方的路径垄断，智谱AI提出了全新的GLM（通用语言模型）路径。若GPT的原理可以被比作“根据上文做完形填空”，那么GLM完形填空的依据则从上文扩充到上下文——理论上，GLM的训练效率会比GPT更高，也能理解更复杂的场景。

△GLM训练原理

基于GLM这个通用大模型底座，目前智谱AI已经开源了中英双语对话模型ChatGLM-6B，还推出了针对代码、视频、图像生成的一系列模型。目前，针对B端企业的模型训练、微调、部署等服务，是智谱AI的主要业务形式。

C端助手编程、搜索更强了，B端API价格下降50%

即便不做中国的OpenAI，但产品线对标OpenAI，是智谱AI成立第一天就写在企业目标中的重点。

△智谱AI对标OpenAI的产品线

此前，智谱AI已经基于ChatGLM推出了生成式AI助手智谱清言。

在CNCC上，智谱AI发布了基于ChatGLM3的新版本智谱清言。相较于上一代，智谱清言的功能不再只是聊天吹水、写诗作画，而是增强了编程、搜索等工具型能力。

除了自然语言，智谱清言将人机交互界面扩展为了多模态，用户可输入代码、图片、图表进行交互。

智谱清言能力。

不过，在现场演示过程中，智谱清言在代码理解上出了一些bug。当输入其自身给出的“生成一颗红心”的代码，智谱清言最后的绘画结果却是两条函数。

bug。

张鹏回应，针对bug，智谱清言具有对代码的自动修正能力。不过，目前智谱清言对代码的修证能力还有待提升。

而面对市场不断增长的智能应用构建需求，智谱AI的MaaS平台“智谱AI开放平台”推出了更为经济的ChatGML商用部署方案：ChatGLM-turbo版本，其API价格相较于直接部署ChatGLM降低了50%。

与此同时，智谱AI开放平台还支持企业直接利用智能应用开发工具，实现5分钟构建应用。

论坛上，智谱的合作伙伴，也带来了最新的模型研究成果。

比如如何合法合规地利用手机等终端设备上的私域数据？Epoch AI Research团队的研究报告就指出：公域中高质量的存量语言数据将在2026年耗尽。数据的短缺让大模型训练不可避免地转向利用私域数据，但数据安全隐患也随之浮出水面。

论坛上，微众银行首席人工智能官、加拿大工程院及加拿大皇家学院院士杨强介绍了“联邦迁移大模型”。所谓的“联邦”，一方面是将公域和私域数据分别进行分布式存储，另一方面是在训练过程中，利用分布式架构将模型在不同数据上进行训练。

长按添加「智涌」小助手入群

👇🏻 添加请备注：公司+职务 👇🏻

欢迎关注

欢迎交流

能力来袭 ChatGLM 模型部署新大智谱价格大降应用 Agent 张鹏清言

上一篇：美媒：NASA计划在国际空间站进行激光通信试验

下一篇：高时空分辨率的环境化学物质的监测与溯源难题

智谱AI新大模型来袭：部署价格大降50%，免费商用，做应用能力逼近GPT3.5 | 最前线

相关内容

热门资讯