科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量
金融界
2024-01-05 15:23:34

原标题:科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量

金融界2024年1月3日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“弱监督数据生成方法、语音识别模型训练方法及相关设备“,公开号CN117334185A,申请日期为2023年11月。

专利摘要显示,本申请公开了一种弱监督数据生成方法、语音识别模型训练方法及相关设备,在获取到现网无监督音频数据及其现网识别结果后,利用至少两种不同类型的语音识别模型,分别对现网无监督音频数据进行识别,根据每条现网无监督音频数据的现网识别结果、各类型语音识别模型的识别结果,筛选识别结果满足设定一致性要求的音频数据,将该一致的识别结果作为筛选后的音频数据的伪标签,得到弱监督数据。本申请无需多轮迭代训练模型,能够利用多种不同类型语音识别模型对识别结果进行交叉验证,避免陷入单一模型局部最优使得模型对识别结果过度自信,提升了预测的伪标签的质量,可以快速生成具有高质量伪标签的弱监督数据,进而训练性能更优的语音识别模型。

来源:金融界

相关内容

热门资讯

运营了17年的MMO,把新手村... 用不一样的方式讲故事。 文/青晖 《剑网3》里有个地方叫稻香村,是个新手村,每个玩家进入江湖的第一站...
原创 L... LOL选手比赛中发生重大失误,赛后连连道歉,发誓自己没有打假赛,这波操作,说实话,用“离谱”形容都不...
原创 梦... 梦幻西游2026春心萌动活动已于昨日12点开启全服投票,仅一天时间,男榜便呈现“神仙打架”的激烈态势...
《沙罗周期》评测9.2分:怒海... “硬核玩法设计教科书” 《沙罗周期》是Housemarque在《死亡回归》问世6载后,推出的又一款“...
原创 哪... 大家好我是指尖,哪吒的新皮肤已经全面曝光,不知道大家看过之后的感受如何,我只能说吸引力拉满了,想必很...