浪潮信息申请视频语言理解专利,提升计算机视觉的视频理解能力
金融界
2024-03-27 22:14:37

原标题:浪潮信息申请视频语言理解专利,提升计算机视觉的视频理解能力

金融界2024年3月27日消息,据国家知识产权局公告,浪潮电子信息产业股份有限公司申请一项名为“一种视频语言理解方法、装置、设备及可读存储介质“,公开号CN117765450A,申请日期为2024年2月。

专利摘要显示,本发明涉及计算机视觉技术领域,具体公开了一种视频语言理解方法、装置、设备及可读存储介质,除视频样本自带的注释文本外,还通过获取如搜索关键词或视频分段信息等视频样本的关联信息,以利用注释文本和关联信息来构建视频样本对应的文本样本,从而弥补视觉模态与文本模态弱相关的问题,在进行视频语言模型的训练时可以为模型提供更为丰富的上下文信息以帮助模型更好地理解视频内容;在视频语言模型的训练中基于该文本样本与视频样本进行视觉文本跨模态编码,解决了传统视频语言模型泛化能力差的问题,提升了计算机视觉的视频理解能力,进而可以精确响应视频语言相关问题。

来源:金融界

相关内容

热门资讯

预约热度居高不下,百万玩家苦等... 现在游戏圈每个月都有新作冒出,但能真正让玩家心甘情愿蹲守的,却屈指可数,如果要我说一款今年最受期待的...
原创 【... 谁家二游还没个吉祥物了,原神的派蒙,绝区零的邦布,鸣潮的阿布。当然有归有,可吉祥物之间亦有差距,隔壁...
《碧蓝幻想 Relink 无尽... “让我先缓缓” 先交个底,我并不是特别喜欢游戏在推出许久后,重新打包推出扩充内容的行为。 这里面倒也...
大疆,掀起手持影像战 6月15日,大疆发布Osmo Pocket 4P(以下简称“Pocket 4P”)双主摄口袋电影机,...
苹果向巴西开放第三方应用商店,... IT之家 6 月 18 日消息,苹果公司今天公布巴西 App Store 一系列重大调整,巴西的开发...