金融界2024年1月3日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“弱监督数据生成方法、语音识别模型训练方法及相关设备“,公开号CN117334185A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种弱监督数据生成方法、语音识别模型训练方法及相关设备,在获取到现网无监督音频数据及其现网识别结果后,利用至少两种不同类型的语音识别模型,分别对现网无监督音频数据进行识别,根据每条现网无监督音频数据的现网识别结果、各类型语音识别模型的识别结果,筛选识别结果满足设定一致性要求的音频数据,将该一致的识别结果作为筛选后的音频数据的伪标签,得到弱监督数据。本申请无需多轮迭代训练模型,能够利用多种不同类型语音识别模型对识别结果进行交叉验证,避免陷入单一模型局部最优使得模型对识别结果过度自信,提升了预测的伪标签的质量,可以快速生成具有高质量伪标签的弱监督数据,进而训练性能更优的语音识别模型。
来源:金融界
上一篇:着眼长远加快布局未来产业
下一篇:支付宝再做“社交梦”