智东西
编译 | 佳扬
编辑 | 云鹏
智东西4月13日消息,据华尔街日报报道,随着全球AI热潮持续升温,算力供给正日益趋紧。
行业头部的Anthropic,不仅陷入系统频繁宕机、服务稳定性大幅下滑的困境,还出现用户投诉、部分企业客户流失的问题。截至4月8日,Anthropic公司的Claude API在过去90天内的正常运行时间为98.95%,低于软件公司通常向客户承诺的99.99%。
▲Claude API服务中断时间(来源:华尔街日报)
华尔街日报3月29日的报道曾指出,OpenAI因算力紧张被迫收缩业务战线,放弃此前备受市场关注的Sora视频生成应用,将有限算力集中投入至代号“Spud”的新AI模型研发中,优先保障核心业务的稳步推进。
与此同时,高端GPU租赁价格迎来惊人涨幅,租用英伟达最先进的Blackwell系列芯片,每小时费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内涨幅接近五成。
一、AI巨头纷纷约束算力
算力短缺已成为头部AI企业发展的核心阻碍,多家巨头不得不通过收缩业务、限制用户资源等方式应对危机。Anthropic首席财务官莎拉·弗莱尔在近期投资者访谈中直言,“我确实花了很多时间寻找任何可用的临时计算资源。目前,由于计算资源不足,我们不得不做出一些非常艰难的取舍,放弃一些我们正在推进的项目。”
算力需求的爆发式增长是这场危机的直接推手。数据显示,OpenAI API的token使用量从去年10月的每分钟60亿次,飙升至今年3月下旬的150亿次,短短五个月内增幅达150%。为应对算力缺口,OpenAI已放弃此前备受市场关注的Sora视频生成应用,将有限的算力集中投入到代号为“Spud”的新AI模型及企业级产品开发中,优先保障核心业务推进。
作为OpenAI的主要竞争对手,Anthropic也面临着相似问题。Anthropic的营收预期一路飙升,从最初预计2025年底实现90亿美元年化收入,到今年2月攀升至140亿美元,两个月后更是翻倍至300亿美元。
但3月下旬,Anthropic被迫出台限制措施,宣布在太平洋时间工作日早5点至11点的高峰时段,限制用户可使用的token数量。这一举措引发用户广泛不满,多位用户在X论坛上抱怨资源消耗过快,有用户表示,此前数周都未用完的token上限,如今仅45分钟就已耗尽。对此,Claude Code创始人兼负责人Boris Cherny在X上回应称,公司正全力应对Claude持续增长的需求,产能作为核心资源需谨慎管理,未来将优先保障核心用户与API使用者的体验。
二、越来越贵的算力
纽约数据提供商Ornn的数据显示,近几个月来,英伟达全系列GPU产品的现货市场价格大幅上涨,尤其是数据中心云端访问的GPU价格,涨幅尤为明显。
算力需求的激增,直接推动行业定价机制调整与长期合同绑定。去年年底,全球最大上市AI云公司之一的CoreWeave将GPU租赁价格上调20%以上,同时将小型客户的服务合同期限从1年延长至至少3年。上月底,美国银行分析师恢复对CoreWeave的“买入”评级,并预测至少到2029年,该公司的算力服务需求仍将持续超过供给,算力紧张局面难以缓解。
具体来看,高端GPU的租赁价格涨幅惊人。根据Ornn计算的价格指数,租用英伟达最先进的Blackwell系列芯片一小时的费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内接近2倍涨幅,凸显算力资源的稀缺性。
“我经营这家公司五年多来,从未见过如此严重的容量短缺。”云基础设施公司Vultr首席执行官JJ Kardwell直言,算力短缺的核心症结并非企业不愿部署更多设备,而是交付周期过长。数据中心建设耗时久,且截至2026年的可用电力已被全部预订一空,短期内无法通过新增设备缓解缺口。
三、算力短缺导致AI服务质量低,客户流失
算力短缺不仅推高成本,更直接影响AI服务的稳定性,甚至导致企业客户流失。自2月中旬以来,Anthropic的系统故障愈发频繁,部分企业客户已开始转向其他AI模型提供商。软件开发平台Retool创始人兼首席执行官David Hsu表示,他此前一直倾向于使用Anthropic的Opus 4.6模型驱动公司AI代理工具,认为其最适配企业级应用,但近期因Anthropic服务器频繁不稳定,已转而采用OpenAI的模型。
互联网核心服务的可靠性通常以“9”为衡量标准,四个“9”(99.99%的正常运行时间)是软件公司向客户承诺的常规标准,但截至4月8日,Anthropic的Claude API在过去90天内的正常运行时间仅为98.95%。
“这不正常。”人工智能推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat评价道,AWS、数据库、RDS或Stripe等核心服务,均需保障极高的弹性和正常运行时间,而当前AI行业的服务质量与之相差甚远,“没有企业愿意为应用程序的智能服务,选择稳定性如此之差的提供商”。
结语:AI的算力竞争
当技术突破的速度超越基础设施建设的步伐,最终考验的不仅是企业的技术实力,更是整个产业链在算力供需失衡下的应变能力。
对于押注AI的科技巨头而言,如何在项目取舍、成本控制与服务质量之间找到平衡,是下一步的关键问题。
来源:华尔街日报