零一万物李开复:用最少的芯片、最低的成本去训练“能力所及”的模型
经济观察报
2024-05-13 22:21:45

原标题:零一万物李开复:用最少的芯片、最低的成本去训练“能力所及”的模型

经济观察网 记者 钱玉娟 5月13日,创新工场董事长兼CEO李开复带队孵化的AI公司零一万物,正式发布了千亿参数规模的闭源模型Yi-Large。这是零一万物发布的首个闭源模型,也是首个千亿参数规模模型。

这次Yi-Large发布,许久未露面的李开复还通过个人抖音账号对发布全程进行了直播。他介绍,在斯坦福评测机构AlpacaEval 2.0官方认证的最新模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度)排到了世界第二,仅次于美国人工智能研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型进入能力力求对标ChatGPT-4的阶段,零一万物在Yi-Large模型能力评测和展示环节,也表示在通用能力、代码生成、数学推理、指令遵循等多方面,模型指标超越了ChatGPT-4、Google Gemini 1.5等同级模型。

除了发布闭源模型Yi-Large,李开复还宣布零一万物早先发布的Yi-34B、Yi-9B等中小尺寸开源模型,版本可升级到Yi-1.5系列。借此机会,零一万物公开了开源、闭源双轨大模型的战略布局。

2023年零一万物创立,以开源模式进入AI领域。2023年11月,零一万物首发Yi系列开源模型,仅一个月后,Yi-34B版本模型成为国内唯一一个被英伟达AI Playground(AI游乐场,一个提供预训练模型和资源的平台)收录的大模型。

Yi系列开源模型发布后,零一万物收到了来自全球开发者的反馈,“从学习、导航、销售、API(应用程序编程接口)的应用到商业写作,都已经开始有早期用户”。李开复认为模型开源会让全球每个用户受益,他甚至觉得,学生、创业者、老师、科研人员、公益组织都需要用大模型,但“无论用ChatGPT-4还是Yi-Large,(他们)都会嫌太大、太贵”。

与OpenAI这一超级独角兽在巨额融资后可以用超级多的GPU展开模型训练不同,“我们是务实的AGI(通用人工智能)信仰者”,李开复说,零一万物走出了一条适合自己的路,就是用最少的芯片、最低的成本去训练“能力所及”的模型。

谈及零一万物的发展方向,李开复称,“我们的精力不会放在行业预测,也不会用大力出奇迹的唯一思维,(去)追求能不能用一百亿美金、一千亿美金(预测AGI的燃点)”,他认为与零一万物相关度更高的是“AI普惠点”,他希望团队成为一个“点燃者”,帮助开发者通过API和Yi系列模型,在电商、社交、娱乐等领域打造出AI时代的淘宝、微信、抖音等。

“现在是分秒必争。”李开复看到国际大厂都在不断迭代进步,零一万物的步伐也在加快,在推出Yi-Large大模型的同时,零一万物内部已经启动了下一代模型Yi-XLarge的相关训练。

李开复称,目前“不是可以做一个模型,然后就休兵半年、一年的时间”,团队正朝着美国前沿大模型去探索模型技术的进步。李开复也见证着中国公司在一个新的环境里快速并野蛮生长,“当然会有一家又一家(公司)慢慢地转型甚至退场”,但他随后说,眼下中国模型市场还在成长中,不要低估中国创业者的生命力。

相关内容

热门资讯

原创 燕... 燕云十六声万事知栾城之四匪鹑匪鸢人任务很多玩家不知道怎么完成,游戏里的万事知玩法很有趣,各种不同的探...
《小小梦魇》原团队发布新作《生... 《小小梦魇》系列游戏原制作团队来自瑞典的Tarsier工作室,于1月17日发布了新作《生灵重塑》的最...
微软Win11更新致关机故障与... 2026-01-19 01:20:23 作者:狼叫兽 2026年1月18日,微软向Windows...
对每一位敢闯敢拼的逐梦企业家,... 封面新闻记者 孟梅 最近两日,追觅CEO俞浩被推上了舆论的“风口浪尖”。 先是,俞浩发朋友圈称要打造...
动物森友会3.0收纳上限怎么提... 动物森友会3.0版本中玩家可以提升空间的收纳数量,玩家可以在收纳空间中放置更多的货物,可以更加方便玩...