最近国内最受关注的两家 AI 公司,悄然走到了一起。
3月11日晚间,Manus 官方宣布与阿里通义千问团队正式达成战略合作。Manus 在公告中称,双方将给予通义千问系列开源模型,在国产模型和算力平台上实现 Manus 的全部功能。
据极客公园了解,双方接触时间并不太长,但却在接触后快速达成合作意向。事实上,就在上周五,极客公园刚推荐了Manus团队前去与阿里巴巴集团相关人士建联交流——基于对阿里云将能够为Manus这一创业团队提供重要支持的判断。事实上,阿里对于创新项目一直非常重视,「他们也清楚自己的能力能够帮助到创业者」。
阿里此次可以说行动非常之迅速,从后续Manus团队朋友圈的分享来看,甚至阿里巴巴集团CEO吴泳铭都很可能都参与了进来,现在,双方已经开始有了明确的下一步计划。而这件事也体现了阿里过去一直秉持的开放心态,以及在开源领域中所展现出的重要力量。
恰逢其时的合作
在Manus上线后,除了对其独立解决复杂任务的惊叹,关于其使用的基础模型引发了广泛的猜测。
此前,Manus联合创始人季逸超就在社交平台透露过,Manus产品使用了 Claude 和不同的基于 Qwen 的微调模型。
图片来源:X
而通义千问推理模型QwQ-32B确实也是这段时间最受关注的 AI 大模型之一。
在Manus发布的同一天,通义千问推理模型QwQ-32B发布并开源。阿里技术的官方报告称,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1:
在一系列权威基准测试中,千问QwQ-32B 模型表现出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的「最难LLMs评测榜」LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
此前有消息称Manus每次调用的成本达2美元,拆解、解决一次复杂任务或消耗百万token,随着用户的增加,任务排队延迟的问题也已经开始出现——在仅采用邀请码制,只有少数人可以使用到的情况下。
Manus的多智能体架构和全链路自主执行能力,意味着它需要处理更复杂的任务和更多的数据,这自然会增加算力的消耗。而且,每个任务在独立的云端虚拟机中运行,虽然保证了任务的独立性和安全性,但也意味着每个虚拟机都需要分配一定的算力资源,也加剧了整体的算力消耗。
在这样的背景下,Manus与通义千问团队的合作尤为重要。通义千问的QwQ-32B模型凭借其出色的推理和执行能力,可以为Manus提供强大的技术支持;同时,QwQ-32B的高效性也有助于降低Manus在算力消耗方面的压力,提升响应速度和处理效率,以应对增长的用户需求。
图片来源:微博
这份声明里可以看出Manus 与通义千问团队的合作主要聚焦于几个关键点:基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能、为中文用户提供服务。
「基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能」表明这次合作的核心是技术层面的深度融合。
尤其「国产算力平台」可能指的是阿里云的云计算基础设施。Manus 原有的独立云端虚拟机架构虽然保证了任务隔离和安全性,但算力消耗巨大。
阿里云可以提供分布式计算资源和更高的算力效率,帮助 Manus 在维持功能完整性的同时降低成本。此外,使用国产算力还能满足中国市场的合规性要求(比如数据本地化)。
考虑到 Manus 每次调用可能消耗百万 token,如何在国产模型和算力上实现同等性能,同时控制成本,将是双方团队面临的挑战之一。
尽管更多细节尚未完全公开,但Manus与阿里的合作已经让人惊喜,这次合作不仅展现了AI行业在竞争之外的合作潜力,也为推动行业的发展提供了新的思路和动力。
合作千问后,Manus 开源?
上周三,Manus 发布后迅速在国内科技媒体和社交网络上刷屏,成为全网热议焦点,研发团队展示了Manus在简历筛选、房产研究、股票分析等任务中的应用案例,显示了在复杂任务处理中的潜力,非常接近理想中的AI Agent。
到了周末,Manus的影响力开始扩展到海外,一些海外媒体和科技博主开始测评和讨论。Hugging Face的产品负责人称其为令人印象深刻的AI工具,Twitter上的科技大佬杰克·多西也对其表示赞赏。
Manus背后的团队是Monica.im,创始人肖弘是一名连续创业者。肖弘在一次访谈中提到「新时代的安迪比尔定律」,模型能力外溢,应用公司可以抓住机会。
在模型公司和应用公司的分工上,肖弘认为垂直领域、特定领域和脏活累活可能是原厂不愿做的,应用公司有机会抓住这个窗口期,提供更专业的解决方案;关于即将推出的Manus,定位是一个消费级产品、大众产品,定价策略倾向于消费级市场,一个对比是,主打编程市场的AI agent 产品Devin每个月定价500美元、ChatGPT Operator定价200美元一个月。
从这个角度来看,Manus 与阿里通义千问的合作本质上或许正是在填补「脏活累活」这一市场。阿里通义千问的模型可以为 Manus 提供强大的技术支撑,使得 Manus 能够将这种复杂技术转化为对普通消费者友好的产品,同时满足行业需求的多样性与特定领域的精准解决方案。
与通义千问团队的合作,或许能帮Manus更好地实现这个定位。
另外,阿里一直在提升其人工智能能力,并通过开源推动行业进步,从2023年至今,通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,囊括0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态,多次登上国内外权威榜单,已成为全球开源社区最重要的模型系列。
3月6日,在Manus发布的同一天,通义千问推理模型QwQ-32B发布并开源。而3月10日,在Manus被意外「开盒」后,Manus 联合创始人 @peakji(季逸超)回应称开源是团队的传统,「近期会有不少好东西开源」。
合作两方都有开源的传统,未来或许可以期待Manus在开源上有更多动作。
上一篇:核物理学家刘畅从美归国,入职北大
下一篇:“睡前故事”不仅仅属于孩子们