歌尔申请远场拾音专利,提升不同场景下的语音识别正确率
创始人
2024-12-22 21:01:17

金融界2024年12月21日消息,国家知识产权局信息显示,歌尔科技有限公司申请一项名为“远场拾音方法、装置、设备及介质”的专利,公开号CN 119152873 A,申请日期为2023年6月。

专利摘要显示,本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率。

来源:金融界

相关内容

热门资讯

原创 拼... 放眼整个2026年,拼多多的核心玩法依然离不开:强付费和自然流两种玩法。也就是,大家做拼多多,如果不...
顶流主播集体扎根,天下贰经典版... 《天下贰・经典版》公测近半年,服务器依旧火爆,金价稳如老狗,新服世外桃源刚开时上号更是人满为患,刚开...
原创 被... 大家好我是指尖,一般来说,一款皮肤的优秀是有侧重的角度的,要么建模做的好,要么创意不错,也有可能是特...
原创 国... 新英雄六耳已经上线几天的时间了,现在大家如果再来评价这个英雄,你觉得是强,还是弱呢? 我的评价依然是...
继“大司马官宣办第二届PUBG... 前言:现在互联网大环境不好,很多游戏主播都叫苦不迭,因为相较于几年前来说,现在直播人气又低,挣钱又少...