OpenAI抨击的“蒸馏”技术 很多大型AI公司正争着用
创始人
2025-03-03 18:41:59

大型公司也开始利用蒸馏技术

北京时间3月3日,当DeepSeek在今年初凭借低成本模型一鸣惊人时,OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道,包括OpenAI、微软和Meta在内的领先AI公司正转用“蒸馏”技术,以便在全球竞争中开发出更便宜、便于消费者和企业采用的AI模型。

通过蒸馏技术,企业使用一个被称为“教师”模型的大语言模型生成数据,然后用这些数据训练一个较小的“学生”模型,从而快速将大模型的知识和预测能力转移到较小的模型上。

虽然蒸馏技术已被广泛应用多年,但是近期的进展使得业内专家相信,对于寻求以经济高效的方法来开发大模型应用的创业公司来说,这项技术将逐渐成为他们的福音。

“蒸馏技术相当神奇,”OpenAI平台产品负责人奥利维尔·戈德门特(Olivier Godement)表示,“其本质上是利用一个非常庞大且智能的前沿模型来训练一个较小的模型……使其在特定任务上具备极强的能力,同时成本极低,执行速度极快。”

OpenAI的GPT-4,谷歌Gemini和Meta的Llama等大语言模型需要海量数据和算力来开发和维护。虽然这些公司尚未披露训练大模型的具体成本,但很可能高达数亿美元。借助蒸馏技术,开发者和企业可以以极低的成本获取这些模型的能力,使应用开发者能够在笔记本电脑和智能手机等设备上快速运行AI模型。

【来源:凤凰网科技】

相关内容

热门资讯

专家辟谣:“打雷戴首饰会遭劈”... 来源:澎湃新闻 夏季多雷雨天气,“打雷不能戴首饰,否则会遭雷劈”等说法又开始流传。记者就此采访了相关...
联想新游戏本来了,64GB内存... IT之家 5 月 26 日消息,联想现已在海外市场发布 Legion 7a 15ASH11 游戏笔记...
继AG决赛落败之后,一诺开心泼... 挑杯决赛结束有好几天了,但是AG粉丝们好没有从低迷的情绪中走出来,也能够理解,毕竟结果确实太可惜了,...
5月:154+4,网易《诡影藏... 刚刚,国家新闻出版署发布了2026年5月的国产游戏版号审批信息,其中国产游戏版号数量154个;进口游...
国家图书馆派员参加国际会议 近期,国家图书馆分别派员参加了国际标准化组织第171技术委员会2026年度工作会议、2026年国际互...