科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量
金融界
2024-01-05 15:23:34

原标题:科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量

金融界2024年1月3日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“弱监督数据生成方法、语音识别模型训练方法及相关设备“,公开号CN117334185A,申请日期为2023年11月。

专利摘要显示,本申请公开了一种弱监督数据生成方法、语音识别模型训练方法及相关设备,在获取到现网无监督音频数据及其现网识别结果后,利用至少两种不同类型的语音识别模型,分别对现网无监督音频数据进行识别,根据每条现网无监督音频数据的现网识别结果、各类型语音识别模型的识别结果,筛选识别结果满足设定一致性要求的音频数据,将该一致的识别结果作为筛选后的音频数据的伪标签,得到弱监督数据。本申请无需多轮迭代训练模型,能够利用多种不同类型语音识别模型对识别结果进行交叉验证,避免陷入单一模型局部最优使得模型对识别结果过度自信,提升了预测的伪标签的质量,可以快速生成具有高质量伪标签的弱监督数据,进而训练性能更优的语音识别模型。

来源:金融界

相关内容

热门资讯

身负争议的诡秘游戏,还是值得期... 我从未如此期待一个IP改编游戏这么久。 从2023年灰雾上唱起的颂歌,到2024年朦胧的廷根旧梦,从...
《恋与深空》6.0前瞻直播,全... 过去一周,关于敖尹的讨论几乎渗透了我的全部生活。从叠纸大楼下巨大的兽爪脚印、神秘的超级圆月直播,再到...
"小孩"曾... 今日,曾卓君在美国EVO 2026《饿狼传说:群狼之城》项目中拿下冠军,收获个人第七座EVO冠军奖杯...
越骂越火,天蚕土豆“反向安利”... 作为网文圈的殿堂级大佬,天蚕土豆每次沉迷游戏后,总喜欢在社交平台抒发自己的感想,文字如同《斗破苍穹》...
手机秒变掌机!Android ... 快科技6月28日消息,据媒体报道,谷歌正在为折叠屏设备开发一项名为“折叠屏游戏模式”的新功能。 该模...