生成式AI
一、 本周大模型诸神混战!DeepSeek等和美国巨头对打
1. xAI、DeepSeek、亚马逊将在下周密集发布新品:Grok 3推出语音和记忆功能、DeepSeek开源五个代码库、Alexa进行AI重大升级;
2. OpenAI计划发布GPT-4.5和GPT-5,时间节点分别为下周和5月下旬,后者将与谷歌I/O开发者大会正面交锋;
3. 阿里将发布基于Qwen2.5-Max的深度推理模型,同时开源新一代视频生成模型WanX 2.1;Anthropic即将推出思考模型。
二、 月之暗面开源MoE模型Moonlight,基于Muon优化器
1. Muon优化器采用矩阵正导化技术,通过均衡参数更新方向,将模型训练效率提升至AdamW的2倍;
2. 该优化器通过加入权重衰减和智能调整参数更新尺度两大关键技术,成功实现大规模模型训练;
3. 基于Muon训练的Moonlight模型在MMLU测试中突破性能边界,并已将全部代码、模型和技术报告开源。
三、 Google “核弹级”AI视频模型Veo 2在Freepik首发
1. Google最新发布的AI视频模型Veo2在Freepik平台首发,具有真实感强、细节丰富、动画流畅等特点;
2. 该模型将通过Freepik平台面向全球设计师、视频制作者等创意群体开放使用;
3. Veo2提供首批10000名用户免费体验权限,用户可通过Freepik平台的AI视频生成器页面申请。
四、 Figure机器人加载自研Helix模型,「拿捏」各类用品
1. Figure AI发布首个通用视觉-语言-行动模型Helix,可通过自然语言直接控制人形机器人整个上半身操作;
2. Helix采用"系统1、系统2"架构,将VLM语言理解与快速反应视觉运动策略相结合,实现200Hz高速精确控制;
3. 该模型经500小时训练数据即可实现对未见过物品的操控,并支持双机器人协作,已可用于商业部署。
五、 腾讯元宝上线DeepSeek新功能,能够理解图片信息
2. 新版本在多模态理解方面表现出色,能准确描述图片场景、进行深度推理,提升复杂问题推理能力;
3. 腾讯元宝近期频繁更新,已实现DeepSeek-R1满血版、混元T1等多个模型的接入,支持图片理解、文件解析和联网搜索等功能。
前沿科技
六、 干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静
1. Neo Gamma人形机器人配备柔软外壳和情感式耳环,噪音降至冰箱水平,可完成煮咖啡、洗衣等家务;
2. 采用强化学习控制系统和远程算法结合,实现自然走路、坐姿等动作,具备视觉操作模型可处理未见过的场景;
3. 1X公司以家庭场景为首要应用目标,区别于其他公司主攻工业场景的策略,获得OpenAI早期支持。
报告观点
七、 新一代码农或不会写代码了,AI正培养「文盲程序员」!
1. 14岁编程天才Namanyay观察到新一代开发者过度依赖AI工具,能交付代码但对底层原理理解不足;
2. 传统StackOverflow问答过程虽慢但能获得深度理解,而AI提供的快速解答难以培养真正的编程思维;
3. 作者建议开发者以学习心态使用AI、加入技术社群、重视代码审查和从零构建项目,在效率和深度理解间寻求平衡。
八、 黄仁勋回应:不要误读 Deepseek,AI 发展远未结束
1. 黄仁勋指出市场对AI存在误区,认为预训练、推理并非AI发展的全部,而Deepseek R1开源将加速AI应用普及而非终结;
2. AI发展分为预训练(基础知识)、后训练(解决问题)、推理(应用实践)三阶段,企业需建立数据智慧层实现数据到洞见的转化;
3. 企业应采用混合AI策略,通过数字孪生技术加速创新,关键在于将AI与组织使命深度融合打造专业化应用。
九、 OpenAI:超1/3美国大学生用ChatGPT,用户破4亿
1. ChatGPT用户数突破4亿,三分之一美国大学生用它写论文和研究项目,70%企业更倾向录用具备AI技能的求职者;
2. AI教育普及需要从认知普及、使用推广、政策完善三方面入手,多所美国高校已开始与OpenAI合作提供教育版服务;
3. OpenAI企业付费用户达200万,开发者调用量半年翻倍,体现AI工具在教育和职场的广泛应用趋势。