头部音乐公司们,正在扎堆拥抱AI。
4月2日,哇唧唧哇发布九周年家族曲《āi ái ǎi ài》。在MV中,AI化身为从天而降的巨龙,而23艺位人则以极具想象力的造型登场——他们与AI试探、对抗,最终走向共处与协作。
在这个充满奇观叙事的文本背后,更值得关注的是一次行业级技术跃迁:哇唧唧哇在群像型音乐影像生产中深度应用了可灵AI,不仅实现了对23位艺人的统一生成与风格控制,还在近5分钟的时长内维持了人物形象的高度稳定与叙事连续性。这种完成度,正在抬升AIMV的行业基准。
哇唧唧哇官方称之为“这是一次WAJI FAMILY向未来的集体表达。”透过这支MV,真正值得被讨论的,正是在一个AI深度参与创作的时代,我们该如何理解“未来”?我们又该如何“表达”?
一场人类与AI的“驯龙”共生实验
在异次元的WAJILAND,周震南身披狮耳铠甲,毛不易腾云驾雾,马伯骞骑着摩托在沙漠中驰骋,机甲上“生长开花”,构成了一种超现实但又高度统一的美学风格。
在9周年的节点,哇唧唧哇从一开始就没有打算讲个传统的故事。
对哇唧唧哇来说,每年“司庆”都是一种前瞻性的战略表达。6周年的“怪6的”,7周年的“7年之young”,8周年的“无限不设限”,到今年9周年的“9ai”——几乎没有争议,AI成为了内部共识。
“AI是一个不可能回避的话题,关键在于我们以什么姿态去面对它。”哇唧唧哇项目总策划陈静怡这样解释。
于是,《āi ái ǎi ài》不只是一个歌名,更像是音乐公司和创作者们的认知路径:从“āi”的初见与好奇,到“ái”的惊讶与感知,再到“ǎi”的反思与对视,最终落在“ài”的接纳与共处。
对于AI的态度,哇唧唧哇选择了一条更克制、也更务实的路径——平视。他们刻意使用小写的“ai”,并赋予其不同声调,让一个原本冷冰冰的技术概念,获得情绪、温度,甚至叙事能力。
更关键的是,这并不只是一个被表达的主题,而是在创作过程中被不断验证的现实。
“最难的,从来不是生成画面,而是让一张脸在不同结果中保持100%一致。”负责概念美学设定的可灵AI超级创作者辣味花手提到。
在获得艺人及经纪公司授权后,辣味花手首先运用传统3D建模技术还原每位艺人的面部结构,并建立私有化的本地人脸库,在离线安全环境中完成数据处理。随后,运用可灵AI进行妆造与场景生成:在保持辣味花手独特画风稳定性的前提下,辣味花手通过可灵AI为每位艺人量身打造风格各异的视觉造型与空间设定,使23位艺人既呈现出强烈的差异化表达,又在统一的美学语境中保持整体协调性与视觉一致性。
在此基础上,团队将3D建模人脸与AI生成的妆造、场景进行精细融合,并通过多轮人工PS进行逐帧校准与精修,持续强化面部还原度与细节真实感,最大程度地还原艺人形象。整个概念设计阶段工作量堪称惊人。每一位艺人发散近 1000 张概念图,23 位艺人总计产出近 2 万张初稿,再从中层层筛选,每组留下3-4张最优方案,与哇唧唧哇团队反复沟通、确认、打磨,最终锁定每一位艺人的最终形象。这一套流程花了近一半的时间,但也让MV中的艺人形象真正“像本人、立得住”。
也正是在这种高度不确定的创作中,一套新的工作逻辑悄然成型。
过去的MV制作,更接近一套分工严密的工业流水线,各个工种“自扫门前雪”。但在AIGC语境下,单个创作者的能力边界被急剧放大,一个人开始具备接近一个团队的产出能力,“超级个体”从概念走向现实。
反馈在作品中,就是那些不可预期、却极具冲击力的“意外正确”。
比如那条象征AI的巨龙。最初哇唧唧哇团队的设想,是更偏东方传统的视觉表达。但当辣味花手交出一个拥有机械关节、半透明血管中流动着荧光血液的版本时,团队迅速放弃了原有路径,新的方案直接抬高了想象力的上限。
创造小剧场的部分时,在那个连接人类过去与未来的空间设定中,创作一度陷入停滞。“写prompt的时候,我更明确地知道‘不要什么’,而不是清楚知道‘要什么’。”辣味花手坦言。
在这种情况下,AI工具通过高频试错逼近答案。直到那个长满异形蘑菇的粉色洞穴出现,团队几乎在瞬间达成共识:这就是他们想要的。某种意义上,这种“由结果反推需求”的路径,本身就是AIGC时代的新方法论。
在这一逻辑下,辣味花手完成概念与美学设定后,可灵AI超级创作者、MV导演BOB二黑接管整体动效与影像生成,工作流随之进入高度模块化阶段。
首先是角色一致性的工程化处理:基于可灵O1的角色库功能,为每位艺人建立“三视图”的数字身份体系,从源头锁定面部结构与形体比例,确保在动态生成过程中不出现面部崩塌、运动跑形等常见问题。
相较于传统流程中耗时的分镜绘制与多轮沟通,BOB二黑转而借助可灵3.0的智能分镜系统,自动生成机位调度与景别组合,并快速输出一版带有专业运镜逻辑的粗剪雏形。由此,“成片感”被前置至创作初期,让团队能够围绕一个具体结果进行判断与校准。
“效果可以达到传统动画的80%-90%”,BOB二黑如此评价。MV中部分卡通角色的舞蹈,正是基于这一能力,将定格动画、玩偶等风格“激活”为动态表达。在最终交付层面,生成视频已可达到2K-4K清晰度,满足商业级制作标准。
也正因此,这支MV的意义不止于一次风格化表达,而在于它跑通了一套可复制、可商用、可规模化的AIGC音乐影像全流程,从制作、审美决策到宣发体系,完成了真正的一体化嵌入。
《āi ái ǎi ài》四个声调的“ai”,既是语言游戏,也是态度声明——对于头部音乐公司而言,AI早已不是“要不要用”的问题,而是一个必须长期共处、持续探索的创作变量。
MV生产逻辑会被彻底改写吗?
伴随着用户从“听音乐”向“看音乐”的消费行为迁移,全球音乐传播结构正在发生显著变化,并进一步推动MV制作市场的持续扩张。
Verified market research的研究报告预测,到2032年全球MV制作市场的规模将达到 203.9 亿美元,2026年至2032年的复合年增长率将达到7.8%。相较于商业广告MV,音乐专辑类MV占据了最大的市场份额,达到70.65%,市场价值达79.15亿美元,预计在预测期内将以8.39%的最高复合年增长率增长。
那么,如何在呈现出MV中呈现出更多可能性,以及在迅速扩张的音乐视觉经济中占据主动地位?
目前来看,积极拥抱AI,打破内容边界,成为了众多头部音乐公司的首选。
从华纳音乐与可灵AI合作的邵氏风虚拟侠女偶像《吴爱花》,到说唱歌手艾热与可灵AI合作的基于可灵AI生成能力实现多重空间自由切换的《在指尖跳舞》,再到借助可灵AI细化情绪表达、提升影像颗粒度的时代少年团六周年MV《I Like U Like》,直至此次哇唧唧哇的23人群像MV,一条清晰的路线浮现:可灵 AI 正在从 “内容生成工具”,升级为 “可商用交付的创意生产力平台”。
对于哇唧唧哇这样的头部音乐公司来说,MV早已不是单一作品,而是整个宣发链路中的核心视觉资产。这也意味着,他们对AIMV的要求不再停留在“能不能做”,而是三连问:能否稳定生成?能否符合商业交付标准?能否助力商业宣发需求?
在这个意义上,以可灵AI为代表的AI工具的真正价值,正在于此:重构工作流、扩展创意边界,以及大大降低档期的协调成本。
以这一次的《āi ái ǎi ài》项目为例,在哇唧唧哇完成整体企划与创意方向设定之后,项目迅速进入以AI为核心驱动的生产阶段:从概念设计、分镜生成、动画合成与后期剪辑等关键环节,进而形成一条高度一体化、端到端衔接的数字化生产流程。
具体而言,AI首先基于文本提示、面部建模与视觉参考完成概念设定与风格统一,在源头上建立内容的美术语言与视觉一致性;借助智能分镜系统,概念设计图生成镜头调度与机位设计,并输出具备基础叙事逻辑的动态粗剪版本;随后进入动画生成与动作绑定阶段,使人物表演与镜头运动实现精准匹配;最终在剪辑与合成环节完成节奏控制、视听匹配与整体包装,使内容直接进入可分发、可传播的“成片形态”。
“当你用AI做一支片子,不再去走实拍的老路线。”可灵AI超级创作者BOB二黑提到,“你就要找一个非常有意思的、不同以往的点去切入,可以尝试不同的风格类型,也可以在相同的成本中叠加更多的想法。”
拍摄条件、制作周期这些曾经决定上限的变量被削弱,大量过去“想得到但做不到”的视觉设想,开始进入可执行区间。创作者不再围绕资源做减法,而是围绕想象力做加法。
成本层面,AI不是简单降低成本,而是重构了成本结构。从传统的场地、置景、拍摄、妆造、人员等“物理成本”,转向算力与创作者投入。传统企划往往受制于预算约束、艺人档期与物理空间条件,而AI的介入显著削弱了这些限制:23位艺人可以在虚拟空间中完成“同框演出”。
正如哇唧唧哇项目总策划陈静怡所言:“过去讨论执行方案,核心问题始终是‘是否可实现’;而现在,只要能够被想象出来,基本就能够被实现。”
最直观的是周期:传统 CG 制作同等复杂度 MV,至少需要半年;而 AI 模式下,从动态生成到整体项目的周期都被大大压缩。时间成本的断崖式下降,正在重新定义内容生产的节奏与规模边界。但与此同时,也显著抬高了对创作者综合能力的要求。
可灵AI超级创作者辣味花手的感受极具代表性:AI正在塑造一种新的审美生产机制,过去需要一个完整3D团队协作完成的内容,如今可以由个人实现。这并不意味着创作变得轻松,反而意味着创作者需要在高频试错中快速迭代审美判断与风格控制能力。
“我refer我自己。”她告诉音乐先声。在持续的创作尝试中,她把可灵AI这样的平台用成了“复制脑”,形成了她在平台上颇具辨识度的风格,让她的作品走向更广泛的商业化空间。
这也印证了一个趋势:AI并没有削弱创作者,反而在重新定义创作者价值。技术能力逐渐普及之后,审美判断、风格建构能力,以及对艺人特质的理解,开始构成新的核心壁垒。
在AIGC语境下,算力只是入场券,创意决定上限,市场验证价值,这三层结构共同定义了内容生产的新坐标。
AI奇点时刻,
MV创作天花板在哪里?
如今,可灵 AI 早已不是小范围试水,而是稳步进入主流制作体系。
例如,《太平年》中选择用可灵AI来制作乌鸦食腐肉的镜头,《马上有戏》等首部AI贺岁动画短片集在可灵AI加持下拓展着题材边界,刷屏的破亿清明AI短片《纸手机》则证明可灵AI同样可以承载高情感浓度的叙事表达。
AI早已不再是先锋导演的尝试,不再是项目中的“亮点技术”,而是一种可以被标准化调用、嵌入生产流程的通用能力——适配不同屏幕形态、不同内容结构,从长剧到短剧,从竖屏到4K,均可复用。
在此背景下,MV正在成为AI技术最具切入价值的内容形态。
从传播绩效来看,海外咨询机构Wifitalent数据显示,官方MV在社交媒体上的互动量较纯音频内容平均高出约300%;自2021年以来,移动端MV观看量同比增长约40%。同时,用户在观看MV后进行付费或歌曲消费的转化概率约为未观看用户的1.8倍,付费转化率更高。
如此一来,内容供给效率成为影响音乐传播效果的关键变量。
然而,传统MV生产模式以线性制作流程为主,整体制作周期长、跨团队协调成本高,俨然已难以适配当前快速迭代的内容传播节奏与高频宣发需求。而在多艺人或复杂制作场景中,生产周期与档期协调进一步增加了难度和成本。
在此背景下,AI通过降低拍摄依赖与缩短后期制作周期,AI技术能够显著提升视觉内容的生成效率,使音乐公司能够在更短周期内完成多样化内容输出,提升新歌发行阶段的内容响应能力与传播覆盖效率。
但更深层的变化,仍然发生在创意维度。
当空间可以被任意折叠,角色可以在多重形态之间自由切换,现实世界的物理约束逐渐失效,MV不再局限于影棚内的表演与调度,而是可以进入更开放的想象空间,探索更复杂的叙事结构与感官体验,“MV如何视觉呈现歌曲内容”这一个核心命题服务。
作为可灵AI超级创作者辣味花手的判断颇具代表性:AI正在重塑一套新的审美逻辑。对行业而言,技术本身正在快速“去稀缺化”,真正稀缺的,变成了如何使用技术——审美判断、风格构建、艺人理解、创意把控。
当创意不再受制于物理世界,MV的上限不再由预算决定,而是由想象力与判断力共同划定。而可灵AI也正在把这一变化继续向深处推进,通过打造连接创作者与商业公司的平台,完成AIGC从创意灵感到到商用交付的闭环。
这才是这支MV更隐含的命题:AI没有取代创作者,但它正在迫使人类重新回答一个更底层的问题——当工具趋近于无限,个体的独特性从何而来?
或许,答案已经被写进结尾。《āi ái ǎi ài》的最后一行提示不是终点,而是一个开放指令——Game not over。对音乐行业、创作者与厂牌而言,下一步,不是被动地适应AI,而是完成一次真正的“level up”:把重复劳动交给技术,把审美、情感与灵魂,还给人本身。
*本文图源网络,如侵权联系删改