清华大学申请音频编解码专利,能够在接收端高质量还原原始音频
金融界
2024-02-23 10:55:39

原标题:清华大学申请音频编解码专利,能够在接收端高质量还原原始音频

金融界2024年2月21日消息,据国家知识产权局公告,清华大学申请一项名为“基于扩散模型的音频编解码方法及装置、存储介质及设备“,公开号CN117577121A,申请日期为2024年1月。

专利摘要显示,本公开涉及一种基于扩散模型的音频编解码方法及装置、存储介质及设备,所述方法包括:接收目标音频的原始波形,并对原始波形进行编码,得到编码后音频向量;对编码后音频向量进行矢量量化,得到压缩后音频信息;接收压缩后音频信息,对压缩后音频信息进行恢复,得到恢复后音频向量,并将恢复后音频向量输入预先训练的扩散模型,将恢复后音频向量恢复为目标音频的原始波形,在目标音频的原始波形通过编码和矢量量化后传输,再经过解码还原原始音频的过程中,利用扩散模型对音频进行编码和解码,使得音频编码量化传输后,能够在接收端高质量还原原始音频。

来源:金融界

相关内容

热门资讯

RNG回归LPL是假消息,系故... 前言:在LPL赛区发展的历史长河中,如果让你选出你最喜爱的一支战队,你脑海里首先浮现的是谁的身影呢?...
全球同步开服!天使之恋 Onl... 玩手游网(www.wanshouyou.net)2026年06月24日讯:由宇峻奥汀推出的可爱冒险M...
腾讯疯狂发力,网易硕果仅存!2... 作为国内游戏业界的领头羊,腾讯与网易一直都备受玩家的关注。如今2026年已经过半,在过去的半年时间里...
《合金装备2》源代码泄露后续:... IT之家 6 月 24 日消息,今年早些时候,《合金装备 2:自由之子》的源代码遭到泄露,此时距离这...
不安全指令,一拒了之?TRIA... 新智元报道 【新智元导读】TRIAD是为AI智能体设计的一种新型安全框架,通过三类决策(继续、更新...