金磊 发自 凹非寺
量子位 | 公众号 QbitAI
杭州在有了六小龙之后,下一个目标,“盯”上了北京的 六小虎—— 智谱。
因为就在最近,从智谱传出来的最新融资消息是这样的:
在杭州的大力支持下,近日智谱完成一笔金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。
而这笔资金的用途,在这次融资消息中也有所透露,会用于智谱国产基座GLM大模型的技术创新和生态发展。
当然,反过来,智谱也会将这笔资金用于更好服务浙江省和长三角地区蓬勃发展的经济实体,全面推动基于人工智能技术的数字产业转型升级。
据悉智谱节后不到一个月收入超过1亿,API平台付费增长超过30%。
随之而来的一个问题就是:
六小虎中有四家base在北京,但 杭州为什么会pick智谱?
为什么是智谱?
如果用一句话来总结,那或许就是智谱 够全、 够快和 够实力。
首先,从大模型发展的版图来看,智谱可以说是国内唯一一个可以 全面对标OpenAI的大模型玩家。
在千亿基座模型、对话模型、代码模型、多模态模型、推理模型和Agent技术等领域,智谱已经实现了全覆盖。
并且它自主研发的 GLM架构全面对标GPT系列,形成了一套完整的超大规模智能模型体系。
GLM架构从底层算子到训练框架均实现自主研发,可以说是突破了西方技术封锁,形成自主可控的创新体系。
OpenAI的GPT系列则主要使用自回归模型,这种模型在生成文本时是单向的,即它只能基于之前的词来预测下一个词。
但这种单向性可能限制了模型在某些自然语言理解(NLU)任务中的表现,因为它无法充分捕捉上下文之间的依赖关系。
而智谱的GLM采用了自回归填空(autoregressive blank infilling)作为主要的预训练目标。这种方法允许模型在生成文本时同时考虑上下文信息,从而增强对语言结构的理解和生成能力。
值得一提的是,GLM原创算法还获得了《自然》期刊报道。
其次,智谱近几年在大模型的迭代速度,在国内大模型玩家范围内,称得上是 够快的。
2024年推出的基座模型GLM-4-Plus、Agent模型AutoGLM、推理模型GLM-Zero等,性能比肩OpenAI同类产品,并在多模态和长文本推理场景中表现突出。
而这还只是智谱众多“发布动作”的一隅,仅是去年,按照时间轴来排序,“打开方式”是这样的:
12月,发布GLM-Zero-Preview,Zero推理模型,擅长通过逻辑推理来解决数理问题。
11月,发布AutoGLM升级版,可自主执行超50步的长步骤操作,也可以跨app执行任务,开启“全自动”上网新体验,支持基于浏览器的数十个网站的无人驾驶。
11月,发布GLM-PC内测,基于智谱多模态模型CogAgent,探索“无人驾驶”PC。可代替用户参与视频会议、处理文档、搜索网页并总结、远程定时操作。
11月,视频模型CogVideoX升级,支持10s时长、4k、60帧超高清画质、任意尺寸以及更好人体动作和物理世界模拟。CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V同期开源。
10月,GLM-4-Voice端到端情感语音模型发布,并上线清言app,能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断。
10月,AutoGLM内测版发布,只需接收简单的文字/语音指令,就可以模拟人类操作手机,不受限于API调用。
10月,和三星、高通宣布合作,分别共同打造AI产品和端侧多模态交互大模型。
8月,发布跨文本音频和视频模态实时推理大模型GLM-4-Videocall,实现AI与人实时视频通话。通过API接口可无缝部署在包括手机在内各类带摄像头端侧设备。
8月,新一代基座大模型GLM-4-Plus发布,语言理解、指令遵循、长文本处理等方面性能全面提升。
7月,视频生成模型“清影”在清言PC端、移动应用端以及小程序端正式上线,提供文本生成视频和图像生成视频的服务,30秒即可完成6秒视频生成,真实还原物理世界中的运动过程。
6月,GLM-4-9B模型开源,支持100万Tokens长文本和26种语言,并首次开源了基于GLM的视觉模型GLM-4V-9B,多模态能力比肩GPT-4V。
1月,新一代基座大模型GLM-4发布,整体性能相比上一代大幅提升,支持更长上下文,具备更强多模态能力,推理速度更快,支持更高并发,大大降低推理成本。
除此之外,和OpenAI所打的“close”路数不同,智谱还是 国内最早开源大模型的企业。
从2021年发布百亿模型GLM-10B,到2022年推出首个千亿开源模型GLM-130B,再到2023年上线ChatGLM,智谱可以说是通过开源推动了中国大模型技术的普及。
而且据了解,智谱今年还计划开源包括基座模型、多模态模型等在内的新一代产品,进一步扩大技术辐射范围。
不仅如此,从 市场范围来看,这也不是智谱第一次受到资本的认可。
就在去年12月份,智谱完成一轮30亿人民币融资,而时隔仅2个月,又得到了来自杭州的10亿元融资。
更早的,就在去年9月,中关村科学城公司宣布以投前200亿估值领投智谱,智谱也是国内估值率先超过200亿的大模型创业企业。
并且智谱的 商业化路径也是清晰,已经形成“模型即服务(MaaS)+私有化部署+智能体平台”的多元模式,已经形成了庞大开发者生态,商业价值高且发展稳定 。
由此,杭州选择智谱,本质上是基于技术自主性、生态开放性、前沿前瞻性、商业可行性四重逻辑。
这一投资不仅是资本行为,更是杭州打造“全国数字经济第一城”的关键落子,有望在AI时代重塑城市竞争力。
会是下一个DeepSeek吗?
在AI竞赛的全球版图上, “DeepSeek时刻”已成为大模型领域的圣杯——它象征着技术突破、生态重构与商业价值的共振。
智谱首席科学家 唐杰昨天也在微博公开表示:
DeepSeek的成功不仅激发了产业界的热情,也让学术界为之一振。它让大学和研究机构意识到了大模型基础理论和技术的重要性。各个大学纷纷加大投入,尤其是理论研究,看来理解AGI的本质就在眼前了。。。大家一起加油。AGI是一个马拉松,我们要调整好节奏,分配好体力,调整心态。
从上述种种总结来看,智谱在国内算的上是非常全面的选手,并且和DeepSeek一样,本着开源、降本的打法。
而一座城市需要的不仅是技术明星,更是能串联芯片厂商、开发者社区、行业用户的生态级企业。
从杭州pick智谱这一举动来看,可以说明智谱是符合这一“气质”的企业。
站在更宏大的视角,回望工业革命史,真正改变文明进程的从不是单一技术突破,而是技术扩散引发的系统性变革。
因此,比起智谱能否在全球范围内再打出一次“DeepSeek时刻”,或许我们更应该期待的是能否打出更系统性的“智谱时刻”。
对于这一点,智谱其实也有自己的布局,提出了一套富有前瞻性的AGI分级架构。
L1是预训练大模型,作为基座,就像知识的“超级富矿”,海量知识汇聚其中,为AI发展筑牢根基。
L2为对齐&推理阶段,堪称“智能激活”时刻。一方面精准匹配人机意图,横跨文本、图像、视频、音频等模态实现对齐;另一方面让机器掌握类人推理与规划能力,告别机械,开启智能蜕变。
发展至L3自我学习阶段,AI实现重大突破。此前L1、L2靠人类引导学习,到这里AI学会自我批评、反思,甚至沉思,凭此应对开放域难题,即便未知挑战,也能像人类般反复尝试、探索求解。
来到L4自我认知阶段,AI新增一项关键能力,能对自身行为、决策结果给出清晰解释,明白因果关联,提升智能的可解释性。
L5意识智能则是AGI顶峰。最终达成”机器科学发现者”的终极形态,使AI不仅能够解决已知问题,更能像人类科学家般提出原创性科学假设。
总而言之,今年国产AI的发展进程,智谱绝对是值得关注的玩家之一。
— 完—