金融界2024年2月5日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“视觉对话方法、视觉对话模型的训练方法、装置及设备“,授权公告号CN111897939B,申请日期为2020年8月。
专利摘要显示,本申请公开了一种视觉对话方法、视觉对话模型的训练方法、装置及设备,涉及视觉对话领域。该方法包括:获取输入图像;获取输入问题的问题文本和问题特征;根据问题文本从输入图像中提取图像实体特征,图像实体特征是与输入问题中的实体对应的图像特征;获取历史问答对话的历史问答特征,并对问题特征、历史问答特征和图像实体特征进行融合处理,得到融合后的特征;根据融合后的特征输出输入问题对应的实际输出答案。通过从输入图像中提取问题中的实体对应的图像实体特征,缩小了与问题相关的图像内容,减少了不相关的视觉信息噪声,提高了答案输出的准确率。
来源:金融界