金融界2024年2月28日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“语音识别方法、装置及电子设备“,授权公告号CN110444203B,申请日期为2019年7月。
专利摘要显示,本公开的实施例提供了一种语音识别方法、装置及电子设备,属于计算机技术领域。该语音识别方法包括:获取当前待识别语音信号的特征信息;通过编码器对所述特征信息进行处理,获得M个语音特征向量,M为大于等于1的正整数;通过CTC模型对M个语音特征向量进行处理,获得M个语音特征向量中的N个发音单元,N为小于等于M且大于等于1的正整数;通过注意力模型对M个语音特征向量和N个发音单元进行处理,生成Y个上下文特征向量,Y为大于等于N的正整数;通过解码器网络对Y个上下文特征向量进行处理,获得所述当前待识别语音信号的识别结果。本公开实施例的技术方案能够提高语音识别的准确度。
来源:金融界