金融界2024年1月19日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“视频识别方法、装置、电子设备及计算机可读存储介质“,公开号CN117423029A,申请日期为2023年10月。
专利摘要显示,本申请提供了一种视频识别方法、装置、电子设备及计算机可读存储介质;方法包括:获取待识别视频;对图像信息对应的多帧视频帧中的每一视频帧及语音信息对应的多段子音频进行特征提取,得到每一视频帧的图像特征向量及每一段子音频的子音频特征向量;对文本信息对应的文本特征向量、全部视频帧的图像特征向量和全部子音频的子音频特征向量分别进行特征映射,对应得到文本映射特征、图像映射特征和音频映射特征;对文本映射特征、图像映射特征和音频映射特征进行跨模态信息融合,得到在同一特征空间下的信息融合特征;基于信息融合特征,确定待识别视频在至少一个预设目标下的视频识别结果。通过本申请,能够提升视频识别的准确率。
来源:金融界