英伟达展示新型人工智能模型:可修改声音和生成新声音
创始人
2024-11-26 08:41:03

鞭牛士报道,11月26日消息,据路透社报道,英伟达周一展示了一种用于生成音乐和音频的新型人工智能模型,该模型可以修改声音并生成新的声音——该技术针对的是音乐、电影和视频游戏制作者。

英伟达是全球最大的人工智能系统芯片和软件供应商,该公司表示,目前还没有公开发布这项技术的计划,该技术被称为 Fugatto,是 Foundational Generative Audio Transformer Opus 1 的缩写。

它加入了 Runway 等初创公司和 Meta Platforms等大型公司所展示的其他技术,可以根据文本提示生成音频或视频,包括像狗叫一样吹响喇叭等新奇的声音。

它与其他人工智能技术的不同之处在于,它能够接收和修改现有音频,例如,将钢琴弹奏的一段歌词转换成人声唱出的歌词,或者将口语录音改变所使用的口音和表达的情绪。

英伟达应用深度学习研究副总裁 Bryan Catanzaro 表示:如果我们回顾过去 50 年的合成音频,就会发现现在的音乐听起来已经不同了,因为有了计算机和合成器。我认为生成式人工智能将为音乐、视频游戏和想要创造事物的普通人带来新的功能。

虽然 OpenAI 等公司正在与好莱坞电影公司就是否以及如何将人工智能应用于娱乐行业进行谈判,但科技界和好莱坞之间的关系变得紧张,特别是在好莱坞明星斯嘉丽约翰逊指责 OpenAI 模仿她的声音之后。

英伟达的新模型是在开源数据上进行训练的,该公司表示仍在讨论是否以及如何公开发布它。

「任何生成技术都存在一定的风险,因为人们可能会利用它生成我们不希望他们生成的东西。」卡坦扎罗说。「我们需要对此保持谨慎,这就是为什么我们暂时没有发布这项技术的计划。」

生成式人工智能模型的创建者尚未确定如何防止滥用该技术,例如用户生成错误信息或通过生成受版权保护的角色来侵犯版权。

OpenAI 和 Meta 也没有透露何时计划向公众发布能够生成音频或视频的模型。

相关内容

热门资讯

狂撒超100万大礼,K总+浮夸... 都说现在搞直播,要懂得让利,什么抽奖、红包都要搞起来,才能对得起家人们的关注。当然了,这种开播福利往...
300名士兵同屏驳火?超拟真战... 市面上的现代战争游戏很多,但大多以载具为主角,反而聚焦于列兵对战的却很少,而《民权战争》就是少数之一...
原创 S... 大家好我是指尖,新赛季刚刚上线几天的时间,有些英雄已经是小黑屋常客了,那么在你看来,哪些英雄可能需要...
新男主风波发酵:叠纸深夜回应 6月28日凌晨,叠纸发布了一则长文,正式回应第六位新男主“敖尹”引发的风波。公告中承认未能充分兼顾玩...
从企鹅岛到火星基地,《失控进化... 6月27日,《失控进化》2026野人节暨上线前瞻发布会在甘肃金昌火星1号基地成功举办。《失控进化》是...