金融界2024年5月6日消息,据国家知识产权局公告,科大讯飞股份有限公司取得一项名为“语音合成方法、装置、设备及存储介质”,授权公告号CN112735373B,申请日期为2020年12月。
专利摘要显示,本申请公开了一种语音合成方法、装置、设备及存储介质,本申请获取到原始文本、原始文本对应的音素序列,以及待合成语音的说话人特征,进而将原始文本以及音素序列进行特征融合,得到融合特征,进而基于融合特征及说话人特征进行编解码处理,得到声学频谱,并基于声学频谱进行语音合成,得到合成语音。本申请通过融合原始文本及音素序列得到融合特征,丰富了输入信息,并且能够挖掘不同语种特有的发音信息,示例如,中文的调型、日语的调核、俄语的重音等均可以通过音素序列得以展示,基于此得到声学频谱并进行语音合成,得到的合成语音更加自然、符合对应语种的发音特点,也即合成语音的质量更高。
来源:金融界