AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图由“千象”(网址:www.hidreamai.com)生成
本周,我们观察到以下AI领域的新动向和新趋势:
1.Mistral发布“旗舰级”大模型Mistral Large,在MMLU测试中,Mistral Large的成绩仅次于GPT-4,超越了Anthropic的Claude 2和谷歌的Gemini Pro,但是Mistral Large不再是一个开源模型。
2.谷歌发布基础世界模型Genie,它能够通过单张图像提示生成可玩的交互式环境,与Sora相比,Genie的动作可控性更强,能够为用户提供更加丰富和真实的交互体验。
3.人形机器人制造商Figure AI获6.75亿美元新融资,投资方包括杰夫·贝佐斯、英伟达、OpenAI,它致力于研发人形机器人,代替一些不适合人类从事的高风险性岗位,以及照顾老年人、探索外太空等更高级的任务。
1.Mistral超大杯模型直逼GPT-4,不开源且与微软合作
Mistral AI近日发布了其“旗舰级”大模型Mistral Large,直接对标OpenAI的GPT-4,它同时推出了名为Le Chat的聊天助手,对所有人开放。
Mistral Large并未像它之前的模型一样开源,而是在Mistral AI自有平台 La Plateforme和微软Azure上使用。
GPT-4、Mistral Large(预训练)、Claude 2、Gemini Pro 1.0、GPT 3.5和 LLaMA 2 70B在MMLU上的比较(测量大规模多任务语言理解)。
在主流基准测试MMLU中,Mistral Large的成绩仅次于GPT-4,超越了Anthropic的Claude 2和谷歌的Gemini Pro,它在多语言能力、推理能力以及编程和数学方面的表现令人印象深刻。此外,Mistral AI还推出了Mistral Small模型,专注于延迟和成本的优化,提供了介于开源模型和旗舰模型之间的解决方案。
2.谷歌发布基础世界模型,一张草图即生一个世界,通才智能体迎来新革命
谷歌最近发布了110亿参数的基础世界模型Genie(精灵),它能够通过单张图像提示生成可玩的交互式环境。这意味着,无论是合成图像、照片还是手绘草图,Genie都能够利用它们生成无限的可交互虚拟世界。
Genie的核心由三部分组成:潜在动作模型、视频tokenizer和动态模型,它们共同工作以预测视频的下一帧,从而创造出连贯的动态环境。Genie通过分析超过20万小时的未标注互联网视频学习而来,无需任何动作标注即可训练,这一点在技术上是前所未有的。
与Sora相比,Genie的动作可控性更强,能够为用户提供更加丰富和真实的交互体验。这意味着,Genie不仅能够创造虚拟世界,还能让用户在这些世界中扮演角色,进行各种活动,从而提供了一个全新的交互式生成环境。
Genie的出现被认为是人类迈向通用人工智能(AGI)的重要一步。它不仅是一个创新的工具,也为培养能够适应多种环境的AI智能体提供了新的可能性。通过Genie,未来的AI智能体可以在一个不断扩展的新世界中进行训练,这将极大地推动AI技术的发展。
3.英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
英伟达最近推出150亿参数的通用大模型Nemotron-4,旨在成为能够在单个A100或H100 GPU上运行的最佳模型。Nemotron-4不仅在参数效率上超越了更大规模的模型,还在多语言处理和编码任务上表现出色。
Nemotron-4的开发受到了“缩放定律”的启发,即在给定的计算力预算下,通过同时优化数据和模型大小来提高模型性能。这种方法的优势在于,它允许通过增加训练数据而不是模型大小来提高性能,从而减少了推理延迟和所需的计算量。
Nemotron-4的架构采用了标准的纯解码器Transformer架构,并引入了旋转位置编码(RoPE)、SentencePiece分词器、MLP层的平方ReLU激活等技术,以提高模型的性能和效率。此外,通过分组查询关注(GQA)技术,Nemotron-4实现了更快的推理速度和更低的内存占用。
4.英伟达发布全新RTX 500 GPU,AIGC性能狂飙14倍!AI应用的门槛彻底被打下来了
在巴塞罗那举行的MWC 2024上,英伟达发布了最新款的入门级移动版工作站GPU,RTX 500 Ada和RTX 1000 Ada。英伟达宣称,这些入门级GPU相较于使用CPU处理AI任务的设备,效率能暴增14倍,这将极大降低AI应用的门槛,使得更多的消费者和专业人士能够享受到AI技术带来的便利。
这两款GPU的推出,是针对轻薄本设计的,虽然核心数和内存数相对较低,但Ada构架所支持的特性并未缩水,包括光线追踪性能的显著提升、深度学习训练和推理过程的加速,以及图形处理和计算任务性能的大幅提升。
5.烧光数十亿美元后,苹果放弃造车转向生成式AI
苹果近日决定放弃L5级自动驾驶技术,转而专注于生成式AI技术的开发,这一决策标志着苹果在自动驾驶汽车领域的努力正式终结。
苹果原本希望打造一款无需方向盘和踏板的全自动电动汽车,但项目在实施过程中遇到了技术挑战、领导层变动和战略调整等困难。近年来,随着全球电动汽车市场的增长放缓,苹果对于造车计划的投入和期望也逐渐降低。
苹果的这一决策虽然结束了其造车梦,但也为公司开启了新的发展方向。转向AI技术的研究和应用,可能会为苹果带来新的增长点和竞争优势。
6.补齐Transformer架构的规划任务短板,田渊栋团队提出Searchformer
尽管取得了显著成就,Transformer在处理规划和推理任务方面仍面临挑战。使用提示工程方法如思维链(CoT)和思维树(ToT),虽然在一定程度上提升了模型的推理能力,但在多步规划和高阶推理任务上的表现依然不尽人意。
为解决这一问题,Meta FAIR的田渊栋团队提出了一种新型Transformer模型—Searchformer,专门针对复杂的多步规划任务设计。
Searchformer通过一种被称为搜索动态引导(search dynamics bootstrapping)的方法,能够有效模仿并超越传统的A*搜索算法,实现更优的规划效果。该方法首先训练一个Transformer模型模仿A*搜索过程,然后通过专家迭代方法进一步优化,使其在更少的搜索步骤中找到最优规划。
田渊栋团队通过在迷宫导航和推箱子等任务上的实验验证了Searchformer的有效性。实验结果表明,Searchformer不仅能够解决93.7%的测试任务,而且在搜索步骤上比A*搜索平均减少了26.8%,展现了其在规划任务上的卓越性能。
7.「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
普渡大学数字孪生实验室最新研究成果,Talk2Drive框架,为自动驾驶汽车领域带来了革命性的人车交互方式。该框架利用大语言模型(LLM)理解人类的自然语言指令,通过高效直观的交互控制自动驾驶汽车,实现了前所未有的人车沟通模式。
Talk2Drive框架的核心流程包括接收命令、处理与推理、生成可执行代码及其执行和反馈收集等关键步骤。通过先进的语音识别技术,框架能准确转换口头命令为文本指令,结合云端实时环境数据(如天气、交通状况等),使LLM在处理命令时能够考虑关键的上下文信息,确保生成的驾驶策略既安全又适应当前环境条件。
Talk2Drive框架的独特之处在于其高度个性化的服务。它能够精确理解并满足乘客的需求,如快速送达目的地或减慢速度以避免晕车等。系统通过记忆模块记录和学习驾驶员的偏好和反馈,提供更加个性化的驾驶体验。此外,实验结果表明,Talk2Drive框架能够理解驾驶员不同晦涩程度的指令,有效降低人为接管的需求,适应不同的驾驶风格和场景。
8.可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步
普林斯顿等离子体物理实验室的研究团队在可控核聚变领域取得了重大突破,他们成功利用AI预测核聚变过程中的等离子体不稳定态,这一成果已经发表在《Nature》杂志上。
这项技术能够提前300毫秒预测等离子体的潜在撕裂,为磁场调整提供足够时间,从而有效防止等离子体逃逸,为实现高功率聚变反应迈出了关键一步。
长期以来,等离子体的不稳定性一直是阻碍核聚变实用化的主要难题。等离子体在高温高压环境下极易发生撕裂,导致能量无法持续释放。
研究团队采用深度神经网络,通过分析过去的实验数据,而非依赖物理模型,成功预测了等离子体的撕裂模式不稳定性。这种预测能力使得AI控制器能够及时调整操作参数,避免等离子体磁场的内部撕裂,维持其稳定状态,防止反应提前结束。这一突破不仅提高了核聚变反应的稳定性和安全性,也增强了科学家对于实现可控核聚变的信心。
此外,研究团队还利用强化学习算法训练AI模型,使其能够在模拟环境中学习控制等离子体的各种策略,找出有效避免不稳定性的方法。这种方法比传统方法更为动态,能够根据实时的等离子体特征,预测未来撕裂模式不稳定性的发生概率,并据此调整控制策略。这项研究的成功,标志着AI技术在核聚变能源开发中的巨大潜力。
1.人形机器人初创公司Figure AI获得6.75亿美元投资,投资方包括贝佐斯、英伟达、OpenAI
官方网站:www.figure.ai
人形机器人初创公司FigureAI获得了大约6.75亿美元的新一轮融资,估值大约20亿美元。
其中杰夫·贝佐斯投资了1亿美元,微软9500万美元,英伟达5000万美元,英特尔2500万美元,OpenAI也投资500万美元。专业风投机构Parkway Venture Capital和Align Ventures分别投资了1亿美元和9000万美元。参与本轮融资的还包括三星、LG Innotek、Tamarack、Boscolo Intervest Ltd.和BOLD Capital Partners等公司和机构。
去年五月,Figure AI获得Parkway领投的7000万美元融资。当时,Figure的首席执行官Brett Adcock表示:“我们希望自己是最早将实用的、能够进行商业活动的人形机器人推向市场的团队之一。”
Figure AI致力于研发人形机器人,代替一些不适合人类从事的高风险性岗位,以及照顾老年人、探索外太空等更高级的任务,以帮助缓解未来的劳动力短缺问题。
Figure AI的技术方案是设计出一款通用型人形机器人,它的外观与人类相似,将会以高速、大批量的生产模式来降低制作成本。此外,Figure AI还试图构建一套人工智能系统,以增强机器人与现实的交互能力。
Figure AI的创始人Brett Adcock此前创立了全电动垂直起降飞机公司Archer Aviation,并成功上市,估值达到27亿美元。Adcock表示,他的目标是以30年的长远视角建立Figure AI,以积极影响人类的未来。
2.韩国AI芯片厂商Rebellions.ai获得韩国电信巨头KT集团领投的1.24亿美元B轮融资
官方网站:rebellions.ai
近日,Rebellions.ai获得由韩国KT集团领投,淡马锡旗下兰亭投资、韩国开发银行等18位投资者参与的1.24亿美元B轮融资,估值达到约6.58亿美元,累计融资额达到约2亿美元。
Rebellions.ai的目标制造人工智能芯片,用于大模型的训练,它的数据中心芯片Atom在Global Benchmark中的测试性能比英伟达和高通等竞争对手高出1.4至3倍。Rebel是Rebellions.ai和三星电子合作共同开发专门针对大语言模型LLM的下一代芯片,它将使用三星4nm工艺,目标是在2024年下半年完成开发。
Rebellions.ai成立于2020年,由三位电子工程领域的多年研究者、工程师,韩国科学技术院电子工程专业的师兄弟Sunghyun Park、Jinwook Oh和Hyo-Eun Kim联合创立。其中,CEO Sunghyun Park也在金融量化投资领域有所建树,在创业前曾担任Morgan Stanley该领域的VP。
3.致力于企业级AI代理工具的Sema4.ai获得Benchmark、Mayfield和Canvas Ventures领投的3050万美元融资
官方网站:sema4.ai
近日,致力于设计企业级AI代理的Sema4.ai获得由Benchmark、Mayfield和Canvas Ventures等知名投资机构领投的3050万美元融资。近日该公司宣布收购开源自动化创新公司Robocorp,加强其为企业构建智能运行、管理代理的能力。
目前,大语言模型(LLM)可以总结大量信息并与人类交谈,但很难支持和简化知识工作者复杂的端到端工作流程。现有的企业自动化解决方案仅限于简单、重复、点对点的任务,因为它们缺乏知识工作的基本能力,例如管理模糊性的智能推理,以及适应不断变化的企业环境并采取实际行动的能力。
Sema4.ai实现有意义的人机协作,支持和简化知识工作者的复杂决策。客户现在可以在最关键的任务工作流程中安全可靠地利用LLM的力量—从低水平、低价值的自动化转向高水平、高价值的基于AI的自动化代理(agents)。
Sema4.ai还宣布发布新的AI Actions框架,该框架直接与LangChain和OpenAI集成。借助Sema4.ai基于Python的AI操作框架,团队可以创建智能代理,使用LLM对其企业系统进行操作。
Sema4.ai的创始团队由Rob Bearden、Ram Venkatesh、Suds Menon和Paul Codding组成,他们在数据管理、分布式系统、应用程序开发和Cloudera等公司的开源方面拥有深厚的专业知识和数十年的经验。通过此次对Robocorp的收购,Robocorp创始人兼首席执行官Antti Karjalainen也加入了创始团队,进一步加深了在开源和自动化方面的经验。
4.AI企业知识管理工具Scribe获得2500万美元融资,Redpoint Ventures领投
提供自动化内部知识获取服务的Scribe获得2500万美元B轮融资,本轮融资由Redpoint Ventures领投,New York Life Ventures参投,并得到了Amplify Partners, Tiger Global和XYZ Ventures等现有投资者的支持。
内部知识管理的概念早已有之,但企业对于内部知识的记录,更新,管理一直数字化程度较低。Scribe找到了一种获取和自动记录内部流程的简易方法。员工只需按下屏幕录制按钮,正常进行操作,然后停止录制。
Scribe能够根据屏幕录制视频自动生成一份包含所有书面指令的文档,其中包括完成业务流程的步骤说明和屏幕截图。除此之外,Scribe生成的自动文档也可以是“说明书”,提升客户的产品体验。
强大的功能和极高的实用性为Scribe吸引了大量优质客户,其CEO兼联合创始人Jennifer Smith表示如今97%的财富500强公司都在使用Scribe产品,并且Scribe已经实现了正现金流。
Scribe由Jennifer Smith和Aaron Podolny联合创立。Jennifer Smith(CEO)毕业于哈佛MBA,曾任职于麦肯锡和Greylock Partners;Aaron Podolny(CTO)毕业于耶鲁,曾任职于Google。
5.通用生物学AI基础模型开发商Bioptimus完成由Sofinnova Partners领投的3500万美元种子轮融资
官方网站:www.bioptimus.com
近日,总部位于巴黎的通用生物学AI基础模型开发商Biooptimus获得Sofinnova Partners领投的3500万美元种子轮融资,参投方包括Bpifrance、Cathay Innovation、Frst、Headline、Hummingbird Ventures、NJF Capital、Owkin、Top Harvest Capital和法国互联网服务移动运营商巨头Iliad的创始人Xavier Niel。
Biooptimus的使命是建立生物学领域的通用AI基础模型,从分子到细胞、组织和整个生物体,以推动科学突破并加速生物医学及其他领域的创新。
Biooptimus的目标是捕捉迄今为止仍然过于复杂而无法正确理解的生物学定律,这种对跨尺度生物学的全面理解对于加速生物医学和环境科学至关重要。与其他市场中存在的生物领域大模型不同,Biooptimus的大模型覆盖生物学的各个领域。
Biooptimus通过与AI生物技术独角兽公司Owkin的合作伙伴关系拥可以访问其来自全球领先学术医院的不公开的多模态患者数据,因此Bioptimus可以比Google DeepMind更快地获得训练生物模型所需的数据。
Biooptimus的联合创始人(CEO)Jean-Philippe Vert是AI生物技术独角兽公司Owkin现任的首席研发官,同时也是国立巴黎高等矿业学院计算生物学中心的副教授,他也曾是Google Brain的机器学习和计算生物学领域在巴黎的负责人。联合创始人(CTO)Rodolphe Jenatton曾任谷歌DeepMind高级研究科学家,在此之前他担任过亚马逊高级机器学习科学家。联合创始人Zelda Mariet博士毕业于MIT人工智能专业,曾担任Google的高级研究科学家。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。