李彦宏谈大模型:榜单不代表实力
创始人
2024-09-12 01:00:27
0

在最近一次和员工的交流中,百度创始人、董事长兼CEO李彦宏谈及了业界对于大模型的三大认知误区,涵盖大模型竞争、开源模型效率、以及智能体的发展趋势等。李彦宏认为,未来大模型之间的差距可能会越来越大。他进一步解释,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要几年、十几年如一日地投入,不断满足用户需求,降本增效。

榜单不代表大模型实力

对于行业“大模型之间的能力已经没有壁垒”的说法,李彦宏坦言,“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距。”

他解释说,很多模型为了证明自己,会在发布之后去打榜,会去猜测试题目、答题技巧。从榜单看,或许模型的能力已经很接近了,但到实际应用中,还是有明显的差距。

李彦宏认为,模型之间的差距是多维度的。行业往往更关注理解、生成、逻辑、记忆等能力差距,但却忽视了成本、推理速度等维度。有些模型虽能达到同样效果,但成本高、推理速度慢。

李彦宏在内部讲话中表示,真正要衡量大模型的能力,应该是在具体的应用场景中,看是否能满足用户需求、产生价值增益,这才是最值得被在乎的。

应客观看待开源模型的效率问题

李彦宏进一步阐释了外界对于开源大模型的认知误区。“在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。”他解释说,比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,无法实现算力的高效利用。

“效率上开源模型是不行的。”他表示,“ 闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU。GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”

李彦宏认为,在教学科研等领域,开源模型是有价值的;但在商业领域,当用户追求的是效率、效果和最低成本时,开源模型就没有了优势。

智能体还不是行业共识

李彦宏还谈及了大模型应用的发展阶段,他认为,首先出现的是Copilot,对人进行辅助;接下来是Agent智能体,有一定的自主性,能自主使用工具、反思、自我进化;这种自动化程度再发展,就会变成AI Worker,能独立完成各方面的工作。

当前,智能体已经受到越来越多的大模型公司及客户关注,李彦宏认为,虽然有很多人看好智能体这个发展方向,但是到今天为止,智能体还不是共识。像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。

为什么要强调智能体?李彦宏也给出了答案。智能体的门槛确实很低,很多人不知道怎么把大模型变成应用,而智能体是一个非常直接、高效、简单的方式,在模型之上构建智能体相当方便。目前,每周都有上万个新的智能体在百度文心智能体平台上被创造出来,智能体的日均分发次数已快速增长至800万次。

作者:温婷

相关内容

热门资讯

原创 从... 前段时间一位朋友找到我们,向我们诉说了Ta与一款保温杯之间的“恩怨”。事情是这样的,这位常年坐办公室...
云手机哪个平台最好 好用又便宜... 在数字化时代,云手机作为一种新兴的服务模式,以其便捷性、高效性和灵活性逐渐受到广大用户的青睐。然而,...
巨星科技申请堆叠系统专利,能够... 金融界2024年9月20日消息,天眼查知识产权信息显示,杭州巨星科技股份有限公司申请一项名为“堆叠系...
原创 小... 在苹果推出新一代iPhone 16系列之后,今年下半年的旗舰手机大战正式拉开了序幕,目前华为这边也已...
构建AI整体布局 哈啰大模型“... IT时报记者 潘少颖 海螺机器人、交易机器人、光子引擎、贾维斯幻视大模型平台……在9月19日开幕的2...
维信诺申请显示面板相关专利,提... 金融界2024年9月20日消息,天眼查知识产权信息显示,合肥维信诺科技有限公司,维信诺科技股份有限公...
中外学者借“AI摄影”寄语年轻... 中新社晋中9月19日电 “当你在AI中输入你的想法时,它生成的东西可以反馈给你,这实际上是一种良性循...
中国移动携5G+智慧医疗成果亮... 9月20日至23日,世界制造业大会市场化展——中国医疗设备创新产品及技术展示博览会在安徽合肥举行。展...
“月满峨眉·金顶探月” 蜀山登... 在中秋佳节的团圆之夜,峨眉山以壮丽的自然风光和科技创新为媒,呈现了一场惊艳的超级月亮直播盛宴。9月1...
自然资源部:计划到2025年初... 中新网9月19日电 国新办19日举行“推动高质量发展”系列主题新闻发布会。自然资源部副部长、国家自然...
北斗追梦 领航苍穹——中国北斗... 9月19日9时14分,我国在西昌卫星发射中心用长征三号乙运载火箭与远征一号上面级,成功发射第59、6...
“医械一哥”迈瑞医疗半年报:净... 今年上半年,虽然受到医疗行业整顿及设备更新政策递延的冲击,但医疗器械“一哥”迈瑞医疗(300760....
从数据中台到数据飞轮:企业升级... 在考虑是否需要升级前,我们需要先来明确数据中台与数据飞轮他们间的关系。 数据中台可以被视作数据飞轮的...
原创 世... 在那遥远的侏罗纪时代,恐龙曾是地球上不可一世的霸主,它们以庞然巨物的姿态,傲然屹立于食物链的顶端。时...
中国电信陕西公司在西安发布全国... 2024年9月19日,中国电信陕西公司在西安举办了以“量子安全算力专网、开启算力自由时代”为主题的全...
小红书内容矩阵怎么构建?自媒体... 标题:《小红书内容矩阵构建指南:自媒体多平台账号管理策略》 在当今信息爆炸的时代,自媒体已成为品牌宣...
HTC发布新款XR一体机,体验... 在近期的发布会上,HTC推出了一款全新的一体式XR头显VIVE FOCUS VISION。相较于其他...
“向新”而行 激光显示行业发展... 今年是激光电视诞生的第十年,值此行业发展承上启下的关键节点,9月19日,2024激光显示技术与产业发...
服务器释放后网站数据还在吗?还... 服务器释放通常指的是服务器租赁合同到期后,服务提供商将服务器资源回收,不再为你提供该服务器的使用权。...
高德首个时空智能城市运营中心落... 9月19日,云栖大会高德“时空智能,AI无处不在”专属论坛上,高德旗下高德云图和杭州深度智联数字科技...