腾讯研究院AI速递 20250224_资讯

创始人

2025-02-24 01:40:34

0次

生成式AI

一、本周大模型诸神混战！DeepSeek等和美国巨头对打

1. xAI、DeepSeek、亚马逊将在下周密集发布新品：Grok 3推出语音和记忆功能、DeepSeek开源五个代码库、Alexa进行AI重大升级；

2. OpenAI计划发布GPT-4.5和GPT-5，时间节点分别为下周和5月下旬，后者将与谷歌I/O开发者大会正面交锋；

3. 阿里将发布基于Qwen2.5-Max的深度推理模型，同时开源新一代视频生成模型WanX 2.1；Anthropic即将推出思考模型。

二、月之暗面开源MoE模型Moonlight，基于Muon优化器

1. Muon优化器采用矩阵正导化技术，通过均衡参数更新方向，将模型训练效率提升至AdamW的2倍；

2. 该优化器通过加入权重衰减和智能调整参数更新尺度两大关键技术，成功实现大规模模型训练；

3. 基于Muon训练的Moonlight模型在MMLU测试中突破性能边界，并已将全部代码、模型和技术报告开源。

三、 Google “核弹级”AI视频模型Veo 2在Freepik首发

1. Google最新发布的AI视频模型Veo2在Freepik平台首发，具有真实感强、细节丰富、动画流畅等特点；

2. 该模型将通过Freepik平台面向全球设计师、视频制作者等创意群体开放使用；

3. Veo2提供首批10000名用户免费体验权限，用户可通过Freepik平台的AI视频生成器页面申请。

四、 Figure机器人加载自研Helix模型，「拿捏」各类用品

1. Figure AI发布首个通用视觉-语言-行动模型Helix，可通过自然语言直接控制人形机器人整个上半身操作；

2. Helix采用"系统1、系统2"架构，将VLM语言理解与快速反应视觉运动策略相结合，实现200Hz高速精确控制；

3. 该模型经500小时训练数据即可实现对未见过物品的操控，并支持双机器人协作，已可用于商业部署。

五、腾讯元宝上线DeepSeek新功能，能够理解图片信息

2. 新版本在多模态理解方面表现出色，能准确描述图片场景、进行深度推理，提升复杂问题推理能力；

3. 腾讯元宝近期频繁更新，已实现DeepSeek-R1满血版、混元T1等多个模型的接入，支持图片理解、文件解析和联网搜索等功能。

前沿科技

六、干完几星期家务，1X新款人形机器人亮相，和冰箱一样安静

1. Neo Gamma人形机器人配备柔软外壳和情感式耳环，噪音降至冰箱水平，可完成煮咖啡、洗衣等家务；

2. 采用强化学习控制系统和远程算法结合，实现自然走路、坐姿等动作，具备视觉操作模型可处理未见过的场景；

3. 1X公司以家庭场景为首要应用目标，区别于其他公司主攻工业场景的策略，获得OpenAI早期支持。

报告观点

七、新一代码农或不会写代码了，AI正培养「文盲程序员」！

1. 14岁编程天才Namanyay观察到新一代开发者过度依赖AI工具，能交付代码但对底层原理理解不足；

2. 传统StackOverflow问答过程虽慢但能获得深度理解，而AI提供的快速解答难以培养真正的编程思维；

3. 作者建议开发者以学习心态使用AI、加入技术社群、重视代码审查和从零构建项目，在效率和深度理解间寻求平衡。

八、黄仁勋回应：不要误读 Deepseek，AI 发展远未结束

1. 黄仁勋指出市场对AI存在误区，认为预训练、推理并非AI发展的全部，而Deepseek R1开源将加速AI应用普及而非终结；

2. AI发展分为预训练（基础知识）、后训练（解决问题）、推理（应用实践）三阶段，企业需建立数据智慧层实现数据到洞见的转化；

3. 企业应采用混合AI策略，通过数字孪生技术加速创新，关键在于将AI与组织使命深度融合打造专业化应用。

九、 OpenAI：超1/3美国大学生用ChatGPT，用户破4亿

1. ChatGPT用户数突破4亿，三分之一美国大学生用它写论文和研究项目，70%企业更倾向录用具备AI技能的求职者；

2. AI教育普及需要从认知普及、使用推广、政策完善三方面入手，多所美国高校已开始与OpenAI合作提供教育版服务；

3. OpenAI企业付费用户达200万，开发者调用量半年翻倍，体现AI工具在教育和职场的广泛应用趋势。