金融界2023年11月17日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“语音处理方法、装置、设备和存储介质“,公开号CN116913278B,专利申请日期为2023年11月。
专利摘要显示,本申请实施例公开了一种语音处理方法、装置、设备和存储介质,涉及人工智能和云技术,该方法包括:对待处理语音数据进行特征提取,得到待处理语音数据的目标语音表征信息;该目标语音表征信息包括待处理语音数据对应的语音内容向量和副语言向量,该副语言向量用于辅助识别待处理语音数据对应的文本信息;获取关于待处理语音数据的提示词,并对该语音内容向量、该副语言向量和该提示词进行融合处理,得到语音融合特征;对该语音融合特征进行语音转换处理,得到待处理语音数据对应的文本信息。采用本申请实施例,可以提升语音识别的准确性。
采集日期:2023年11月19日
来源:金融界