国家知识产权局信息显示,苏州市广播电视总台、苏州数广科技有限公司申请一项名为“一种视频合成方法及系统”的专利,公开号CN121691843A,申请日期为2025年12月。
专利摘要显示,本发明公开了一种视频合成方法及系统,涉及音视频处理技术领域。一种视频合成系统,包括有视频源获取与处理模块、跨模态语义理解模块、注意力张量生成模块、分层渐进式融合模块和质量评估与优化模块。本发明通过三维卷积网络提取时空联合特征并构建音频‑视觉跨模态注意力机制,能够量化音频事件与视频内容的动态关联强度并生成主体空间掩码,从而将传统孤立的视觉处理扩展为音画语义联动理解,以实现多模态信息对合成过程的深度指导,提升了此视频合成方法及系统的合成效果。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯