一种基于跨模态动态权重分配的AI视频处理方法及系统

正文

推荐专利

申请号：CN202511091661

申请日期：2025-08-05

公开号：CN120976828A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及人工智能与多媒体处理交叉技术领域，尤其涉及一种基于跨模态动态权重分配的AI视频处理方法及其系统，该方法包括以下步骤：S1、接收多模态输入数据；S2、通过模态专用特征提取器分别提取各模态数据的语义特征；S3、通过跨模态注意力机制对提取的特征进行语义对齐，所述跨模态注意力机制动态分配模态权重；S4、将语义对齐后的特征输入多模态Transformer进行特征融合，生成统一的多模态语义表示；S5、基于所述多模态语义表示，生成式神经网络生成视频帧序列，S6、对视频帧序列进行后处理；S7、输出视频文件。本发明通过跨模态动态权重分配，解决关键模态特征弱化问题，并跨模态注意力单元精准响应语义场景。

技术关键词

动态权重分配跨模态多模态权重分配策略文本预训练语言模型 Kubernetes集群注意力机制视频帧特征提取器语义特征场景分类优化器教育类音频特征 LSTM神经网络模型数据模型压缩

系统为您推荐了相关专利信息

一种基于多模态数据的电力场景图生成方法及装置

语义特征多模态场景文本生成方法

一种用于预测房产交易量的系统

变量情绪词典分析模块 Pearson相关系数数据采集模块

一种基于LangChain4J的本地知识库问答系统、方法、设备及介质

智能问答平台分布式数据库知识库问答方法知识库管理文本

一种基于用户行为数据的广告图片投放方法

广告图片兴趣风格时间段关键词

视频生成方法、装置、可读介质、电子设备及程序产品

图片视频生成方法音频机器学习模型视频生成装置

一种基于跨模态动态权重分配的AI视频处理方法及系统

站点导航

APP 下载