歌尔申请远场拾音专利,提升不同场景下的语音识别正确率
创始人
2024-12-22 21:01:17

金融界2024年12月21日消息,国家知识产权局信息显示,歌尔科技有限公司申请一项名为“远场拾音方法、装置、设备及介质”的专利,公开号CN 119152873 A,申请日期为2023年6月。

专利摘要显示,本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率。

来源:金融界

相关内容

热门资讯

省政协委员:打通科技成果转化“... 打通科技成果转化的“最后一公里”,不仅需要政策引导,更需要懂技术、懂市场、懂高校的复合型人才作为桥梁...
优化人工智能应用生态 来自国务院新闻办公室的消息,2025年我国人工智能产业活力迸发、成绩显著,人工智能企业数量超6000...
大厂们的春节“豪赌”:莉莉丝、... 进入2月,恰逢春节黄金档期,新老游戏之间的市场竞争预计将趋于白热化。据陀螺君初步统计,2月共有24款...
拓元科技申请用于成型魔术贴立柱... 国家知识产权局信息显示,广州拓元科技发展有限公司申请一项名为“一种用于成型魔术贴立柱的模具组件”的专...