金融界2023年12月1日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“一种音频处理模型训练方法以及音频处理方法“,公开号CN117153179A,申请日期为2022年5月。
专利摘要显示,本申请提供了一种音频处理模型训练方法和相关装置,涉及音频数据处理领域。其方法包括:首先,根据去噪音频序列生成混噪音频序列,再对混噪音频序列进行时频特征转换,生成音频特征序列;接着,将音频特征序列作为音频编码模型的输入,通过音频编码模型输出音频增强特征序列;然后,将音频增强特征序列作为线性网络层的输入,通过线性网络层输出聚类类型特征、去噪频域特征、噪音频域特征以及混响频域特征并且计算损失结果;最后,采用损失结果对音频编码模型以及线性网络层进行训练。本申请某一实施例提供的音频处理模型训练方法,通过在音频处理模型中增加了噪音子网络层以及混响子网络层,实现同时进行去噪和去混响的训练,提升训练效率。
来源:金融界