智能体产生的网络流量最高可达人类的450%,并已开始以可量化的方式重塑网络流量格局。
思科最新研究显示,在不引入智能体AI的情况下,企业网络流量预计在未来十年内增长2.5倍;而一旦智能体AI得到广泛应用,受自主任务执行与推理密集型工作流驱动,这一增幅将跃升至现有流量水平的9倍。
思科发布的最新研究报告《AI对广域网络的影响2026》指出,AI与智能体AI不仅会推动流量总量的增长,还将"改变流量的形态、对称性、持续时长及业务关键性"。报告强调:"AI推理路径将成为战略性网络资产,需要具备高度的韧性、可观测性以及差异化处理能力,例如服务质量(QoS)保障与路径安全防护。"
该报告综合了多类研究方法,包括基于思科Crosswork Assurance用户体验服务的真实流量分析、第三方行业数据,以及思科实验室针对AI智能体的受控测试。研究内容涵盖对服务提供商网络中实时AI推理流量的直接测量,以及对AI流量特征的系统测试,并以此训练模型,以识别并精准追踪网络中的AI流量。
思科首席产品管理工程师哈维尔·安蒂奇(Javier Antich)与服务提供商连接业务高级副总裁古鲁·申诺伊(Guru Shenoy)在一篇关于该研究的博客文章中写道:"对于服务提供商、网络架构师以及数字基础设施负责人而言,真正的风险不在于AI流量会突然大量涌现,而在于误以为它与其他流量并无二致——但事实并非如此。"
两位作者指出,智能体以机器速度而非人类速度运行,这一差异改变了一切。
他们写道:"如果说AI模型是这个新时代的'大脑',那么网络便是'神经系统'。当自主智能体开始以规模化的机器速度代替人类行动、决策与交易时,这套连接神经系统必须做好充分准备。如果你正在规划容量、设计架构或制定未来十年的战略,这一议题不是可选项,而是根基所在。尽管AI推理通常被视为计算或GPU层面的问题,但报告中的洞察表明,随着推理能力的持续演进,网络层面的重要性正日益凸显。"
报告指出,过去数十年间,业界始终围绕以人类节奏为主的突发性视频流对网络进行优化,而智能体AI的兴起正在改变网络流量的特征与行为模式。
"预计到2035年,四分之一的网络流量将来自AI推理(数据来源:思科模型)。这类流量与网页流量截然不同——它存续时间更长,对上行带宽需求更高,且以软件速度而非人类速度运行,"报告指出,"智能体逻辑与AI模型之间的连接,实际上成为智能体的'脊髓'——一种关键依赖,任何网络性能的下降都将直接损害智能体的功能表现。"
报告同时指出:"尽管与视频流媒体等主导流量类别相比,AI推理流量目前仍微乎其微,但其观测增速极为惊人。Token消耗数据显示,年同比增长接近10倍,而在部分服务提供商的测量中,仅八个月内便出现了约4倍的增长。按此速率持续增长,AI流量将在2035年前成为整体网络流量中不可忽视的重要组成部分。"
思科报告还援引了多项第三方研究,揭示智能体AI将以多快的速度进入企业网络。例如,高德纳(Gartner)预测,到2026年,40%的企业应用将集成特定任务的AI智能体,而2025年这一比例尚不足5%。高德纳还预计,到2035年,智能体AI将驱动企业应用软件收入的约30%,全球规模将超过4500亿美元(而2025年这一占比仅为软件收入的2%)。
思科还援引了IBM 2025年全球高管调查的数据:24%的商业领袖表示其运营中已有AI智能体独立采取行动,67%的受访者预计到2027年将有AI智能体在工作流中自主完成决策。
思科表示:"从本质上看,到2035年,企业软件市场中近三分之一的份额可能源于AI智能体能力——这是十年内的根本性变革。届时,大多数企业软件预计将深度嵌入AI智能体,新的软件商业模式也将围绕自主功能展开。"
报告的其他主要发现如下:
流量增长趋势
"2029年至2032年间,网络总流量将经历显著增长,这一时期也是智能体AI采用率大幅提升的阶段,AI推理流量的复合年均增长率(CAGR)将达到约25%,"思科报告指出。
数据流持续时长
"AI推理流量与非AI网页流量相比呈现出不同特征,这些差异虽不算剧烈,但可能对容量规划产生影响。数据流时长分析表明,AI推理流与常规网页事务之间存在明显差异——统计数据显示,AI推理流的持续时间是常规网页事务的2倍,"思科指出,"主要原因在于AI推理流量的内容生成方式——逐个Token生成,导致流量持续时间更长、传输速率更低。"
较长流量时长的影响
"对于需要在流表中维护流状态的'流感知'网络系统而言,AI推理流量的长期化意味着流表的持续扩张,必须纳入有效的规划考量,"思科指出,"随着时间推移,安全系统与流感知网络系统很可能需要向更分布式的方向演进,以应对转发状态的持续增长。"
数据流速率特征
"与流量时长直接相关,AI推理流量的数据流速率相较常规网页事务呈现出不同模式。常规网页事务的中位流速率是AI推理流量的10倍,"思科指出,"这一差异的根本原因在于AI推理的数据生成机制——常规网页流量的峰值远高于AI推理流量,因为内容可以直接从存储位置提取并交付给用户。"
流速率差异的影响
"不同的中位平均流量与峰均比,可能需要在网络中针对AI推理流量与非AI推理网页事务配置不同的QoS策略,"思科指出。
流量不对称性
"网络流量的不对称性因接入类型(移动网络与有线网络)及服务类型而有所不同,"思科指出,"AI推理流量与非AI网页事务在流量对称性上存在明显差异:AI推理流量中,9%的流具有上行流量多于下行流量的特征,而在其他HTTP事务中,这一比例仅约为0.5%。"
流量不对称性的影响
随着智能体AI采用率的提升,网络流量对称性模式预计将发生更为显著的变化。"尤其对于无线容量规划而言,流量对称性假设是一个关键因素。随着AI推理与智能体AI的持续普及,追踪流量对称性的演变趋势至关重要,因为这一指标将随时间推移持续下降,"思科指出。
网络延迟影响
"大语言模型推理请求的延迟通常远高于典型网页API调用,且响应时间的波动性更大。传统网页应用的REST API通常追求亚秒级甚至100毫秒以内的响应时间,"思科指出,"相比之下,即便是短小的大语言模型查询,仅开始生成输出就需要数百毫秒,完整响应往往需要数秒钟。"
AI推理延迟的影响
"AI推理延迟的范围跨度较大,从数百毫秒到数秒不等,"思科指出,"网络延迟将成为推理分布的关键因素,并与规模、数据主权、安全性等因素共同发挥作用。此外,服务提供商还需要监测用户实际体验到的AI推理延迟,因为这是影响用户感知体验的核心指标。"
Q&A
Q1:思科报告中提到智能体AI会产生多少倍于人类的网络流量?
A:根据思科最新研究,智能体产生的网络流量最高可达人类的450%。此外,报告预测,若智能体AI得到广泛采用,企业网络流量增幅将从无智能体情况下的2.5倍跃升至现有流量水平的9倍,主要由自主任务执行与推理密集型工作流驱动。
Q2:AI推理流量和普通网页流量有什么区别?
A:AI推理流量与普通网页流量存在多方面差异:AI推理流持续时间约为普通网页事务的2倍;普通网页的中位流速率是AI推理流量的10倍;AI推理流量中有9%上行流量多于下行,而普通HTTP事务仅约0.5%;大语言模型推理延迟也远高于传统API,完整响应往往需要数秒钟。
Q3:到2035年AI推理流量会占到网络总流量的多少?
A:根据思科模型预测,到2035年,约四分之一(25%)的网络流量将来自AI推理。Token消耗数据显示AI流量年同比增长近10倍,部分服务提供商仅在八个月内便观测到约4倍增长,按此速率AI流量将在2035年前成为网络流量的重要组成部分。