科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量
金融界
2024-01-05 15:23:34

原标题:科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量

金融界2024年1月3日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“弱监督数据生成方法、语音识别模型训练方法及相关设备“,公开号CN117334185A,申请日期为2023年11月。

专利摘要显示,本申请公开了一种弱监督数据生成方法、语音识别模型训练方法及相关设备,在获取到现网无监督音频数据及其现网识别结果后,利用至少两种不同类型的语音识别模型,分别对现网无监督音频数据进行识别,根据每条现网无监督音频数据的现网识别结果、各类型语音识别模型的识别结果,筛选识别结果满足设定一致性要求的音频数据,将该一致的识别结果作为筛选后的音频数据的伪标签,得到弱监督数据。本申请无需多轮迭代训练模型,能够利用多种不同类型语音识别模型对识别结果进行交叉验证,避免陷入单一模型局部最优使得模型对识别结果过度自信,提升了预测的伪标签的质量,可以快速生成具有高质量伪标签的弱监督数据,进而训练性能更优的语音识别模型。

来源:金融界

相关内容

热门资讯

艾芬达获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示艾芬达(301575)新获得一项发明专利授权,专利名为“一种可...
来郑州科技馆定格春光吧 走进科技馆,探秘大自然 本报讯(记者 刘盼盼 文 徐...
触控屏+更好看+更强悍,坐等今... “触控并不适合垂直方向,虽然演示效果很好,但短时间内就会感到疲劳,长时间使用后手臂就会酸得要掉下来,...
厂家推荐:厦门海川润泽物联网科... 雷达明渠流量计与物联网技术:厦门海川润泽的智慧水利解决方案 在智慧水利与物联网技术深度融合的当下,...
天开园全力推动科技创新与产业创... 春回大地,协同聚力。随着《现代化首都都市圈空间协同规划(2023—2035年)》的实施,京津冀协同发...