蚂蚁百灵大模型最新进展:已具备原生多模态能力
创始人
2024-07-06 19:20:25

7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。

发布现场,蚂蚁集团副总裁徐鹏展示了新升级的多模态技术可实现的更多应用场景:通过视频对话的自然形式,AI助理能为用户识别穿着打扮,给出约会的搭配建议;根据用户不同的意图,从一堆食材中搭配出不同的菜谱组合;根据用户描述的身体症状,从一批药物中,挑选出可能合适的药,并读出服用指导,供用户参考等。

基于百灵大模型多模态能力,蚂蚁集团已在探索规模应用落地产业的实践。论坛上同时发布的“支付宝多模态医疗大模型”,便是这一探索的实践。

基于百灵大模型多模态能力,由蚂蚁集团与武汉大学联合研发的遥感模型SkySense,也在论坛上公布了开源计划。

“从单一的文本语义理解,到多模态能力,是人工智能技术的关键迭代,而多模态技术催生的‘看听说写画’的应用场景,将让AI的表现更真实,更接近人类,从而也能更好地服务人类。蚂蚁会持续投入原生多摸态技术的研发。”徐鹏说。

相关内容

热门资讯

当AI遇上资本:马斯克的预言是... "当AI的算力突破奇点,资本主义的基石将开始崩塌。"埃隆·马斯克在2026年达沃斯论坛上的这番论断,...
潍坊智慧城管小程序新增年货大集... 春节临近,年味渐浓,市民置办年货、休闲出行的需求日益增长。近日,市城管执法支队对“潍坊智慧城管”微信...
OpenAI回应ChatGPT... 1 月 21 日消息,OpenAI 为实现通用人工智能(AGI)的愿景筹集资金,确认未来几周在 Ch...
我国首台!芯片制造核心装备取得... 近日,据中核集团中国原子能科学研究院消息,由该院自主研制的我国首台串列型高能氢离子注入机(POWER...
中国移动申请图像分割方法专利,... 国家知识产权局信息显示,中国移动紫金(江苏)创新研究院有限公司、中国移动通信集团江苏有限公司、中国移...