10月24日-25日,由声网和RTE(实时互动)开发者社区联合主办的RTE2023第九届实时互联网大会在北京举办,围绕人工智能对于实时互动行业的影响,多位业内大咖发表了观点。
声网创始人兼CEO赵斌表示,随着AIGC(人工智能自动生成内容)能力进一步加强,越来越多应用型开发将被AIGC替代。硅谷著名孵化器Founders Space创始人兼CEO 史蒂夫‧霍夫曼则指出,在人工智能和实时互动技术加持下,新的穿戴设备可能会进入市场。人工智能伴侣这一概念也将成为人们社交生活、娱乐、事业的一部分。
不过AI大模型的发展机遇与挑战并存。小红书音视频架构负责人陈靖指出,对于很多公司而言,说清楚一些AI大模型项目的必要性是一个巨大挑战。商汤科技商务总监、数字文娱事业部副总裁李星冶提到,在为许多C端流量产品提供服务时,算力、带宽、智力相关的弹性储备是很现实的挑战,同时,大模型开发厂商如何平衡投入和预期收入之间的关系,也是挑战。
越来越多应用型开发将被AIGC替代
回顾2023年,AIGC大模型驱动着各行业迎来新业务机会,AR、VR、XR等技术能力的迭代为实时互动在各个领域的应用提供了更多可能。在直播社交领域,弹幕玩法成为直播新风口,这些变化都影响着RTE行业的进化。
智能和高清正在推动实时互动体验进入全新时代,在大会上,赵斌宣布:“声网在RTE行业首次实现广播级4K超高清实时互动体验。”广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰,并以此提升观影体验。
赵斌认为,虚拟人+AIGC所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着AIGC能力的进一步加强,越来越多的应用型开发将被AIGC替代,API+AI的形式将大幅提高应用开发效率。
AIGC被认为是当前的技术革命,它与RTE的深度结合,又将带来什么改变呢?硅谷著名孵化器Founders Space创始人兼CEO 史蒂夫‧霍夫曼在分享中指出:“在AI赋能的RTE未来,每个人都会拥有更加个性化的体验,更加动态的程序将随着图形、音频、视频的实时变化而变化。在更深层次上,AI还将为人类增加更多的生产力水平,带来动态的虚拟世界等等,让人们感受到更多的沉浸体验。”
霍夫曼表示:“在人工智能和实时互动技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,它可以让我们听到人类听力范围之外的频率。此外,脑机接口也将读取我们的脑电波,帮助我们实现冥想或对其他设备的控制。”在工业实时互动场景应用下,人们可以聚在一起,实时通过虚拟或真实工厂观看流水线运作、产品生产等。在人工智能陪伴场景中,人工智能伴侣这一概念将成为人们社交生活、娱乐、事业的一部分。
综上,未来可能会有各种类型的伴侣应用以及新的实时接口方式出现,甚至会出现一套为RTE开发的全新硬件,这些都将极大改变RTE领域的发展前景。
AI大模型的发展机遇与挑战并存
声网首席科学家、CTO钟声在现场带来了技术视角的分享。钟声指出,大模型的突破,人工智能的发展,让信息传播和消费智能化的趋势越来越明显,万事归于中心化AGI(通用人工智能)接管的趋势和威胁也越来越明显。大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受能源供给力限制、大模型数据资源不够、存储需求增长过快等问题。
“未来,我们除了要做负责任的人工智能之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化AGI对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势。”钟声说。
钟声认为,通用人工智能将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过人工智能分身丰富体验、缓解时间稀缺的瓶颈。此外,他预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。
AI技术的发展也为各行各业带来了用户体验改善和场景玩法创新。喜马拉雅首席科学家卢恒表示,喜马拉雅从文本处理到音频内容生成的过程中都使用了大量的AI技术,目前,AIGC生成的音频内容日均播放量已超过250万小时。Soul APP技术副总裁张高政则表示,大模型的理解能力对于UGC平台来说,它不仅可以快速提升内容生产效率,还能降低内容生产门槛。
AI大模型的发展机遇与挑战并存。小红书音视频架构负责人陈靖指出,对于很多公司而言,说清楚一些AI大模型项目的必要性是一个巨大挑战,很多项目并不像利用AI去做体验增强那样,能够跟用户留存及转化的一些指标建立关联。商汤科技商务总监、数字文娱事业部副总裁李星冶则提到,在为许多C端流量产品提供服务时,算力、带宽、智力相关的弹性储备是一个很现实的挑战,其二,大模型开发厂商如何平衡投入以及预期收入之间的关系,也是一个挑战。
新京报贝壳财经记者 孙文轩
编辑 徐超
校对 杨许丽