清华大学申请音频编解码专利,能够在接收端高质量还原原始音频
金融界
2024-02-23 10:55:39

原标题:清华大学申请音频编解码专利,能够在接收端高质量还原原始音频

金融界2024年2月21日消息,据国家知识产权局公告,清华大学申请一项名为“基于扩散模型的音频编解码方法及装置、存储介质及设备“,公开号CN117577121A,申请日期为2024年1月。

专利摘要显示,本公开涉及一种基于扩散模型的音频编解码方法及装置、存储介质及设备,所述方法包括:接收目标音频的原始波形,并对原始波形进行编码,得到编码后音频向量;对编码后音频向量进行矢量量化,得到压缩后音频信息;接收压缩后音频信息,对压缩后音频信息进行恢复,得到恢复后音频向量,并将恢复后音频向量输入预先训练的扩散模型,将恢复后音频向量恢复为目标音频的原始波形,在目标音频的原始波形通过编码和矢量量化后传输,再经过解码还原原始音频的过程中,利用扩散模型对音频进行编码和解码,使得音频编码量化传输后,能够在接收端高质量还原原始音频。

来源:金融界

相关内容

热门资讯

【独立游戏通讯】2026年-#... 《诺娃独立游戏通讯》系列主要介绍一些近期由站内开发者创建以及值得开发者关注的内容,内容基本上来自 i...
悟空是阿里打造Agentic计... 文 | 窄播,作者|李威 3月17日英伟达CEO黄仁勋在GTC大会上预测,到2027年,英伟达的订单...
Chrome加密绕过新发现:恶... 一种新型信息窃取恶意软件正在绕过Chrome的应用程序绑定加密(ABE),使用研究人员称在野外尚未观...
一场年会的科技密度有多高?博鳌... 如果用一个词 形容今年的博鳌亚洲论坛 会是——“日常” 机器人迎宾,是日常 机器狗巡检,是日常 扫码...
余霜宣布怀孕后Rita开播又被... 前言:在英雄联盟LPL赛区中,有很多的电竞主持人和解说员,其中还有一些人喜结良缘了,比如管泽元和余霜...