清华大学申请音频编解码专利,能够在接收端高质量还原原始音频
金融界
2024-02-23 10:55:39

原标题:清华大学申请音频编解码专利,能够在接收端高质量还原原始音频

金融界2024年2月21日消息,据国家知识产权局公告,清华大学申请一项名为“基于扩散模型的音频编解码方法及装置、存储介质及设备“,公开号CN117577121A,申请日期为2024年1月。

专利摘要显示,本公开涉及一种基于扩散模型的音频编解码方法及装置、存储介质及设备,所述方法包括:接收目标音频的原始波形,并对原始波形进行编码,得到编码后音频向量;对编码后音频向量进行矢量量化,得到压缩后音频信息;接收压缩后音频信息,对压缩后音频信息进行恢复,得到恢复后音频向量,并将恢复后音频向量输入预先训练的扩散模型,将恢复后音频向量恢复为目标音频的原始波形,在目标音频的原始波形通过编码和矢量量化后传输,再经过解码还原原始音频的过程中,利用扩散模型对音频进行编码和解码,使得音频编码量化传输后,能够在接收端高质量还原原始音频。

来源:金融界

相关内容

热门资讯

新模型发布、新实验完成……浦东... 近日,浦东机器人企业接连取得最新技术成果。智元具身研究中心推出两项新成果,为机器人产业注入新动能。微...
兴鸿辉科技取得一种充电桩外壳专... 国家知识产权局信息显示,惠州市兴鸿辉科技有限公司取得一项名为“一种充电桩外壳”的专利,授权公告号CN...
北大团队创出全新计算架构提升算... 1 月 10 日消息,据新华社今日报道,北京大学科研团队在计算技术领域取得一项重要突破,其创造的一种...
对话创维创始人黄宏生:去年光伏... 1月11日,创维集团(00751.HK)创始人黄宏生在2026年度演讲中提及最多的是光伏、AI家电和...
专家解读 | 数据要素推动完善... 文 | 国家工业信息安全发展研究中心副总工程师 汪礼俊 国家数据局发布的《工业制造、现代农业等九个领...