重大突破!联汇科技OmChat在多图和视频理解基准测试中取得飞跃进展
创始人
2024-09-23 10:21:40

近日,联汇科技自研多模态大模型OmChat在多图评估基准测试集Mantis-Eval中取得优异成绩,在8B级别模型中排名第一,超越GPT-4V。在视频评估基准MMBench-Video中排名紧随GPT和Gemini之后。本次取得的最新成绩标志着联汇科技在处理复杂视觉和文本信息方面再次取得重要突破。

Mantis-Eval基准测试集是评估AI模型在理解和生成与多张图片相关语言任务能力的重要测试,MMBench-Video是全面评估长视频理解能力的基准测试,OmChat在两项重要测试中取得的优异成绩,超越其他行业头部模型,进一步展示了视频内容理解方面的卓越性能。

多模态大模型的一个主要挑战是如何高效管理和利用图像序列和视频帧的超长上下文数据。联汇科技自研OmChat 通过多阶段的训练,可以支持最长达 512K 词元,能够处理视频、图、文复杂的混合输入,具有卓越的时序关系判断和多图关系理解能力,能够精准捕捉、判断视频时序信息,洞察多图之间的复杂关系,达成长视频理解的重要突破。

随着OmChat等模型能力的突破,正在加速解锁更多行业应用场景,大模型技术在视频处理领域便捷优势将得到巨大释放,联汇科技为更多行业智能化升级提供最新的技术支撑。

相关内容

热门资讯

重庆升级“企业码上服务” 企业... 来源:中国消费网 中国消费者报重庆讯(记者刘文新)记者1月26日获悉,重庆升级“企业码上服务”体系,...
宇树科技卖了5500台人形机器... 撰文:程孟瑶 丨 出品:瑞财经 会扭秧歌的机器人“炸场”央视蛇年春晚后,宇树科技出圈,整个2025年...
光荣特库摩宣布《真・三国无双2... IT之家 1 月 27 日消息,光荣特库摩宣布旗下原定于 3 月 19 日发售的《真・三国无双 2 ...
暴雪将连办四场游戏专题发布会,... IT之家 1 月 27 日消息,暴雪娱乐宣布将在 2026 年年初举办一系列专题发布会,分别围绕其旗...
浙江永强获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示浙江永强(002489)新获得一项实用新型专利授权,专利名为“...