金融界2024年6月7日消息,天眼查知识产权信息显示,TCL科技集团股份有限公司申请一项名为“语音合成方法、装置、设备以及计算机可读存储介质“,公开号CN202211565727.5,申请日期为2022年12月。
专利摘要显示,本申请公开了一种语音合成方法、装置、设备以及计算机可读存储介质。该方法包括:确定目标用户和待合成文本;获取目标用户的音色嵌入特征和韵律嵌入特征;根据第一语音合成模型、音色嵌入特征和韵律嵌入特征对待合成文本进行处理,得到具有目标用户的音色的语音数据。本申请的方案在对目标用户进行语音合成时,无需获取该用户的大量语音来训练模型,而是根据通用的语音合成模型,以及能够表征该用户的音色的音色嵌入特征和韵律嵌入特征对所述待合成文本进行合成,得到具有该用户的音色和韵律的语音数据,提高了个性化语音合成的效率。
来源:金融界