大语言模型有领导力吗?
络绎科学
2024-03-27 16:16:24

原标题:大语言模型有领导力吗?

随着大模型推理能力和决策能力的显著提高,AI 智能体已经可以胜任个人生活助理、软件开发工程师等等角色。其中,具身 AI 智能体可以与环境实时交互并进行自主决策,其也因大模型的出现可以适应更加多变的环境,与智能机器人等落地场景的距离不断缩短。同时,大模型让 AI 智能体前所未有地通过自然语言交互进行协作,智能体之间可以用人类能够轻易理解的语言沟通任务进度、遇到的困难等等,这些为 AI 在复杂决策系统中的应用打开了新的大门。

然而,多个 AI 智能体间的沟通合作还面临着诸多挑战。

在训练和微调过程中,大模型往往容易出现过度报告信息和过度服从指令的问题,难以像人类一样灵活沟通、随机应变,这可能会导致合作中的信息冗余和决策混乱。如何高效地进行信息交换,以达成更优的集体决策,还需要进一步探索,从而将大模型更有效地应用到诸如自动驾驶之类的实际多智能体系统中。

那么,AI 智能体是否能够像人类一样展现出领导力呢?AI 的领导力能否帮助整个系统达成更优的集体决策?

针对这一问题,来自普林斯顿大学王梦迪团队与认知学家 Thomas L. GriffithsNatalia Vélez 合作,在 AI 多智能体系统中探索了人类组织结构和领导力的实现。相关论文以《具身大模型智能体在有组织团队中学习如何合作》(Embodied LLM Agents Learn to Cooperate in Organized Teams)为题发布在论文预印本网站 arXiv 上。

清华大学博士生郭旭东为本文第一作者,普林斯顿大学王梦迪教授为本文通讯作者。宾夕法尼亚州立大学的吴清云教授和俄勒冈州立大学的王华政教授也参与了本文工作。

图1 大模型在多智能体合作的应用还存在过度报告信息和过度服从指令的问题

当 AI 智能体的智力水平和社交能力越来越与人类趋近,我们是否可以从人类数千年历史积淀的合作模式中得到启发,来指导 AI 智能体的合作?

心理学、经济学和组织学的研究表明,人类组织中每个个体的信息与注意力都是有限的,因此,适当的组织结构和领导模式可以提高整体效率和产出。例如,公司的管理模式和架构对于公司营收和发展有着重要影响。层级结构(hierarchy)是一个典型的组织结构,在适当的层级结构中,特定个人或群体拥有更大的权力和权威,担任领导职能,能够提高人类组织的运行效率。

那么,层级结构在社会系统中提高效率的作用是否也适用于 AI 智能体系统,可以缓解大模型本身的合作缺陷?

研究团队基于大模型多智能体框架 AutoGen(https://microsoft.github.io/autogen/)和 CoELA(https://arxiv.org/pdf/2307.02485.pdf)实现了具身 AI 智能体的动作决策和通讯功能,并提出了新的智能体间的通讯协议来赋予智能体尽可能大的通讯自由度。智能体通过观测模块(Perception Module)将对环境和对队友状态的局部观测转变为自然语言,与记忆模块(Memory Module)中记录的动作历史和通讯历史等等一并构成了智能体中大模型的提示词(prompt)。在大模型输出当前的决策规划后,进一步由执行模块(Execution Module)分解为每一步在环境中执行的具体动作,从而实现了分层规划(hierarchical planning)。由此构建的多个具身 AI 智能体可以在虚拟公寓(VirtualHome)中合作完成各种家务。由于每个智能体只可以观测到所处房间的状态,此时智能体间的通讯和有组织协调对高效完成任务显得尤为重要。在这样的具身多智能体系统中,通过在 prompt 加入一句组织结构描述,例如“智能体 1 号是这项任务的领导者(Agent 1 is the leader to coordinate the task)”,AI 智能体便可以自行形成具有层级结构的组织。

在实验中,具有领导者的 AI 智能体团队相较没有领导者时,团队完成任务的效率提高了 30%,而额外增加的通讯量至多只有 3%。AI 智能体也可以自行选举团队中的领导者,通过通讯实现领导者的轮替。

同时,在有领导者的团队合作中,AI 智能体惊人地涌现出了许多与人类合作相近的行为,不但可以主动询问或分享新的信息,还形成了上下级间的任务分配和汇报行为。当 AI 智能体完成当前子任务后会向领导者征求新的任务计划;如果智能体的计划与领导者的规划有冲突,领导者也会进行纠正。

图2 有领导者的AI智能体团队涌现出了丰富的合作行为

在与人类组织相似的架构下,AI 智能体团队与人类的合作也成为了可能。自然语言的沟通和对人类意图的理解让 AI 智能体可以适应人类,成为团队的一员甚至是领导者。当然,实验表明,目前 AI 智能体的领导力相较于人类还有提升空间。

AI 智能体不但可以按照人类设计的 prompt 来实现组织结构,还可以引入额外的大模型对组织的 prompt 进行迭代。王梦迪团队沿着强化学习(Reinforcement Learning, RL)的思路设计了批评-反思(Critic-Reflect)框架,大模型可以根据 AI 智能体团队的过往行为和表现进行评估和改进,自主设计并生成新的组织结构 prompt。这种迭代过程有助于形成更有效的团队结构,提高合作效率。

图3 大模型可以对AI智能体团队的组织结构进行改进,从而提高效率

放眼未来,可以预见下一代大模型的能力会以前所未有的速度不断提高,AI 智能体之间以及和人类的合作,对于新质生产力的形成和发展有着重要意义。

另一方面,AI 智能体逐渐融入人类组织和社会,也使得 AI 的安全使用和监管治理越来越重要。这需要更多跨学科的研究来确保 AI 智能体在认知、伦理和社会层面学习人类、支持人类、忠于人类。

本文内容不代表平台立场,不构成任何投资意见和建议,以个人官网/官方/公司公告为准。

相关内容

热门资讯

分享房卡“微信金花房卡在哪里买... 您好!炸金花链接房卡可以通过以下几种方式购买:打开微信添加客服【66336574】,微信渠道:微信游...
分享知识“微信炸金花房卡/白虎... 微信游戏中心:炸金花房卡,添加微信【71319951】,进入游戏中心或相关小程序,搜索“微信炸金花房...
卡丘“撞”星塔,射击撑场面,看... 2025年Q4上线的新品不少,只是多数产品成绩平平,虽有成功突围者表现亮眼,但其成绩距离现象级仍有一...
分享房卡“牌九房卡如何购买/怎... 您好!炸金花链接房卡可以通过以下几种方式购买:打开微信添加客服【71319951】,微信渠道:微信游...
分享知识“九人金花链接房卡/新... 微信游戏中心:金花房卡,添加微信【66336574】,进入游戏中心或相关小程序,搜索“微信金花房卡”...