英伟达展示新型人工智能模型:可修改声音和生成新声音
创始人
2024-11-26 08:41:03

鞭牛士报道,11月26日消息,据路透社报道,英伟达周一展示了一种用于生成音乐和音频的新型人工智能模型,该模型可以修改声音并生成新的声音——该技术针对的是音乐、电影和视频游戏制作者。

英伟达是全球最大的人工智能系统芯片和软件供应商,该公司表示,目前还没有公开发布这项技术的计划,该技术被称为 Fugatto,是 Foundational Generative Audio Transformer Opus 1 的缩写。

它加入了 Runway 等初创公司和 Meta Platforms等大型公司所展示的其他技术,可以根据文本提示生成音频或视频,包括像狗叫一样吹响喇叭等新奇的声音。

它与其他人工智能技术的不同之处在于,它能够接收和修改现有音频,例如,将钢琴弹奏的一段歌词转换成人声唱出的歌词,或者将口语录音改变所使用的口音和表达的情绪。

英伟达应用深度学习研究副总裁 Bryan Catanzaro 表示:如果我们回顾过去 50 年的合成音频,就会发现现在的音乐听起来已经不同了,因为有了计算机和合成器。我认为生成式人工智能将为音乐、视频游戏和想要创造事物的普通人带来新的功能。

虽然 OpenAI 等公司正在与好莱坞电影公司就是否以及如何将人工智能应用于娱乐行业进行谈判,但科技界和好莱坞之间的关系变得紧张,特别是在好莱坞明星斯嘉丽约翰逊指责 OpenAI 模仿她的声音之后。

英伟达的新模型是在开源数据上进行训练的,该公司表示仍在讨论是否以及如何公开发布它。

「任何生成技术都存在一定的风险,因为人们可能会利用它生成我们不希望他们生成的东西。」卡坦扎罗说。「我们需要对此保持谨慎,这就是为什么我们暂时没有发布这项技术的计划。」

生成式人工智能模型的创建者尚未确定如何防止滥用该技术,例如用户生成错误信息或通过生成受版权保护的角色来侵犯版权。

OpenAI 和 Meta 也没有透露何时计划向公众发布能够生成音频或视频的模型。

相关内容

热门资讯

“前女友发的短信有人知道是什么... “前女友深夜发来一条短信是什么意思...?” 哈哈哈我们对前任念念不忘的人 是这样的! 你的语言我都...
卡普空《生化危机:安魂曲》免费... IT之家 5 月 27 日消息,卡普空现已为旗下《生化危机:安魂曲(Resident Evil Re...
原创 农... 农心网咖推出scout套餐,取名为“还清债务”,被举报后公开道歉,近日,一则围绕电竞选手与品牌联动的...
原创 《... 《坦克世界:HEAT》于5月26日免费上线,登陆PC、PS5/PS6 以及 Xbox Series ...
该给《异环》“验牌”了 凭借1.0强劲的流水表现充分证明潜力,坐上头部二游牌桌的《异环》,自4月23日公测至今已过一月。如今...