AI 开源之战打响!谷歌Gemma登上开源大模型“铁王座”,全面狙击Meta
格隆汇
2024-02-22 12:09:25

原标题:AI 开源之战打响!谷歌Gemma登上开源大模型“铁王座”,全面狙击Meta

硅谷大厂们,在这轮AI浪潮上已经卷出新高度。

当地时间2月21日,科技巨头谷歌发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma,全面狙击Meta的开源模型Llama 2。

周三美股收盘,谷歌涨1.15%报143.84美元,总市值达到1.79万亿美元。

“ 高性能、 轻量级 ”

Gemma 是谷歌基于 Gemini 推出的4个新 LLM 模型系列。

它分为20亿、70亿两种参数规模,每个规模又分预训练指令微调两个版本。每个参数都有基本和指令调整的变体。

其中,7B参数用于在消费级GPU和TPU上高效部署和开发;2B版本则可直接在笔记本电脑上运行。

据谷歌介绍,Gemma是一个轻量级、最先进的开放式模型,采用与Gemini模型相同的研究和技术,由Google DeepMind和谷歌其他团队开发,专为负责任的AI开发而打造。

性能方面,谷歌称Gemma 模型与Gemini共享技术和基础设施组件。与其他开放式型号相比,这使得 Gemma 2B 和 7B 能够在其尺寸范围内实现同类最佳的性能。

谷歌表示,Gemma 在关键基准上超越了更大的模型。

在18个语言理解、推理、数学等关键基准测试中,Gemma有11个测试分数超越了Meta Llama-2等更大参数的开源模型。

开发人员和研究人员可以免费访问 Gemma,以便在 Kaggle 中进行研究和开发,也可以通过 Colab 笔记本的免费套餐进行访问。

对于开发人员,谷歌还提供了各种用于 Gemma 部署的工具,包括用于 JAX、PyTorch 和 TensorFlow 中的推理和监督微调的工具链。

首次使用 Google Cloud 的用户可以获得 300 美元的 Gemma 积分;申请的研究人员可以获得高达 50万美元的 Google Cloud 积分。

开源的Gemma,无疑将会吸引软件工程师在谷歌技术的基础上进行开发,并鼓励使用其新盈利的云部门。

目前,可以通过 Colab、Hugging Face、Kaggle、Google 的 Kubernetes Engine 和 Vertex AI 以及 NVIDIA 的 NeMo访问谷歌 Gemma。

谷歌登上AI开源铁王座?

当下,AI大模型的开源之战已经打响。

近两年,OpenAI掀起了全球科技竞赛,头部科技大厂们你追我赶、厮杀甚是激烈。

前有闭源代表OpenAI 的GPT-4 Turbo大模型,但其只能通过 ChatGPT 应用程序和云 API 获得,不能在本地运行。

另一科技巨头Meta自去年 2 月以来也一直在大力进攻开放权重模型,例如LLaMA和Llama 2 。

但不管是在开源还是闭源上,谷歌是既要也要。

近一个月来,谷歌先后发布了大模型Gemini Ultra、Gemini 1.5、Gemma,大有要“拳打OpenAI,脚踢Meta”的样子。

作为曾经AI领域扛把子的谷歌,这一年多来,风头几度被抢,一直处于被压着打的境地。

在AI竞逐中,虽然OpenAI、Meta、微软等巨头一直都是很强的对手;但在AI开源上,谷歌似乎已经登上了开源大模型的铁王座。

目前,Gemma的主要竞争对手主要包括:Meta 的开源大型语言模型 Llama 2、Mistral AI 的 7B 模型、Deci 的 DecilLM 和Microsoft 的 Phi-2,以及旨在在组织自己的硬件上运行的类似小型生成式 AI 模型。

但放眼看,Gemma一马当先。

值得关注的是,Gemma还有芯片巨头英伟达的加持。

英伟达最新表示,已经和谷歌展开合作,确保 Gemma 模型在其芯片上顺利运行。

公司称,很快将开发与 Gemma 配合使用的聊天机器人软件,该软件正在开发用于在 Windows PC 上运行人工智能模型。

相关内容

热门资讯

RNG回归LPL是假消息,系故... 前言:在LPL赛区发展的历史长河中,如果让你选出你最喜爱的一支战队,你脑海里首先浮现的是谁的身影呢?...
全球同步开服!天使之恋 Onl... 玩手游网(www.wanshouyou.net)2026年06月24日讯:由宇峻奥汀推出的可爱冒险M...
腾讯疯狂发力,网易硕果仅存!2... 作为国内游戏业界的领头羊,腾讯与网易一直都备受玩家的关注。如今2026年已经过半,在过去的半年时间里...
《合金装备2》源代码泄露后续:... IT之家 6 月 24 日消息,今年早些时候,《合金装备 2:自由之子》的源代码遭到泄露,此时距离这...
不安全指令,一拒了之?TRIA... 新智元报道 【新智元导读】TRIAD是为AI智能体设计的一种新型安全框架,通过三类决策(继续、更新...