文|周鑫雨
编辑|邓咏仪
2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。
这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果,他们更是为了秀出各家厂商的大模型“肌肉”,展示产业落地的成功:
这也意味着,如今落地成果代替技术参数,成了大模型厂商最重要的竞争力。
10月27日,作为AI赛道备受瞩目的独角兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。
△在CNCC,智谱AI CEO张鹏发布新一代模型
在论坛上,智谱AI发布了新一代的中英双语对话模型ChatGLM3和生成式AI助手智谱清言,并在智谱AI开放平台上推出了新的模型训练和部署方案。据智谱AI CEO张鹏介绍:
ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。
△在最新AgentBench上,ChatGLM3-turbo版本的Agent能力
智谱AI的下半年可谓好事连连:
8月31日,在8家首批获网信办批准向公众提供大模型产品服务的公司中,智谱AI占有一席。其研发的千亿参数对话模型“智谱清言”顺势面向公众开放;
在近几个月完成的B-4轮融资中,智谱AI的股东出现了腾讯战投、阿里云战投等头部互联网战投和基金的名字。2023年,智谱AI已经累计获得超25亿人民币融资,一跃成为AI赛道的独角兽。
如今的智谱AI的核心团队,除了首席科学家唐杰、CEO张鹏等清华知识工程实验室出身的创始人,还迎来了新面孔——智源研究院副院长刘江,曾经光年之外(王慧文创立的AI公司)的核心成员,如今首次以“智谱首席生态官”的角色出席CNCC。
新一代ChatGLM3发布,特定任务下接近GPT-3.5水平
论坛上,智谱AI对标GPT-4V发布了新一代的对话模型ChatGLM3,并推出了1.5B、3B、6B规模参数的不同版本。相较于ChatGLM2新增的1.5B版本,已经能够部署在笔记本电脑、手机和汽车上。
CEO张鹏介绍,ChatGLM3主要在4四个方面进行了性能提升:
接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力。
接入了代码增强模块 Code Interpreter,能根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。
接入了网络搜索增强模型WebGLM,进行了联网。
增强了语义理解和逻辑理解能力。
值得一提的是,如今AI Agent(智能体)已经成为构建AI原生应用的新风向。为此,ChatGLM3集成了智谱AI自研的AgentTuning技术。
如何理解这项技术?就像义务教育和专科教育之间的关系,对于大模型而言,通用性和特定场景下的能力往往成反比:通用性强的大模型构建的Agent,执行特性任务的能力反而会变弱。
AgentTuning技术的关键点在于构建了一个轻量但高质的指令调整数据集。通过这一指令调整数据集,大模型可以在增强对特定任务的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。
智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。
“大模型元年”,在开场演讲上,智谱AI首席科学家、清华大学计算机系教授唐杰如此戏称今年的“百模大战”。
他表示,今年预训练模型真正的创新型的学术研究少了,而基于一个强大底座疯狂训练模型的人变多了,只需要加个名字,就成了新的模型。
那么,智谱AI如何理解创新型的学术研究?
此前在36氪的专访中,张鹏就表示“智谱AI不做中国的OpenAI”。在他看来,中国没有自己的预训练模型框架,市面上最主流的三种模型训练路径(GPT、BERT、T5)都来自西方。
为了打破西方的路径垄断,智谱AI提出了全新的GLM(通用语言模型)路径。若GPT的原理可以被比作“根据上文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。
△GLM训练原理
基于GLM这个通用大模型底座,目前智谱AI已经开源了中英双语对话模型ChatGLM-6B,还推出了针对代码、视频、图像生成的一系列模型。目前,针对B端企业的模型训练、微调、部署等服务,是智谱AI的主要业务形式。
C端助手编程、搜索更强了,B端API价格下降50%
即便不做中国的OpenAI,但产品线对标OpenAI,是智谱AI成立第一天就写在企业目标中的重点。
△智谱AI对标OpenAI的产品线
此前,智谱AI已经基于ChatGLM推出了生成式AI助手智谱清言。
在CNCC上,智谱AI发布了基于ChatGLM3的新版本智谱清言。相较于上一代,智谱清言的功能不再只是聊天吹水、写诗作画,而是增强了编程、搜索等工具型能力。
除了自然语言,智谱清言将人机交互界面扩展为了多模态,用户可输入代码、图片、图表进行交互。
智谱清言能力。
不过,在现场演示过程中,智谱清言在代码理解上出了一些bug。当输入其自身给出的“生成一颗红心”的代码,智谱清言最后的绘画结果却是两条函数。
bug。
张鹏回应,针对bug,智谱清言具有对代码的自动修正能力。不过,目前智谱清言对代码的修证能力还有待提升。
而面对市场不断增长的智能应用构建需求,智谱AI的MaaS平台“智谱AI开放平台”推出了更为经济的ChatGML商用部署方案:ChatGLM-turbo版本,其API价格相较于直接部署ChatGLM降低了50%。
与此同时,智谱AI开放平台还支持企业直接利用智能应用开发工具,实现5分钟构建应用。
论坛上,智谱的合作伙伴,也带来了最新的模型研究成果。
比如如何合法合规地利用手机等终端设备上的私域数据?Epoch AI Research团队的研究报告就指出:公域中高质量的存量语言数据将在2026年耗尽。数据的短缺让大模型训练不可避免地转向利用私域数据,但数据安全隐患也随之浮出水面。
论坛上,微众银行首席人工智能官、加拿大工程院及加拿大皇家学院院士杨强介绍了“联邦迁移大模型”。所谓的“联邦”,一方面是将公域和私域数据分别进行分布式存储,另一方面是在训练过程中,利用分布式架构将模型在不同数据上进行训练。
长按添加「智涌」小助手入群
👇🏻 添加请备注:公司+职务 👇🏻
欢迎关注
欢迎交流
欢迎交流