基于混合专家动态融合的多模态视频摘要方法及系统

正文

推荐专利

申请号：CN202510817728

申请日期：2025-06-18

公开号：CN120950730A

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及多模态人工智能技术领域，公开了一种基于混合专家动态融合的多模态视频摘要方法及系统，通过提取视频特征和文本特征，视频特征包括时序特征，将视频特征、时序特征和文本特征通过混合专家融合后生成视频摘要，采用混合专家融合特征，混合专家根据融合特征动态选择专家组合，得到不同视频‑文本对的最佳融合策略，提取更符合视频场景的特征，从而生成更符合视频场景的摘要，并且在融合时结合了时序特征，解决了视频摘要任务中时序建模与模态融合的关键难题，不仅提高了特征提取的准确率，还提升了时序连贯性。

技术关键词

关键帧时序特征文本视频摘要方法生成视频摘要融合特征视频帧编码器序列特征选择视频摘要系统卷积神经网络提取交叉注意力机制 BERT模型特征提取模块人工智能技术动态

系统为您推荐了相关专利信息

一种通用机器人对话交互式任务规划方法和系统

封装器解析器实时人机交互机器人控制执行器

一种基于大语言模型和信息融合的漏洞严重程度预测方法

漏洞大语言模型程度预测方法信息融合方法模板

表格的信息提取方法、计算机程序产品和信息提取系统

合并单元格训练识别模型信息提取方法信息提取系统监测系统

一种基于图结构学习的聚类模型构建方法及装置

模型构建方法编码器动态更新聚类数据

基于大语言模型的整数规划自动建模方法

整数规划模型自动建模方法大语言模型神经网络模型数据

基于混合专家动态融合的多模态视频摘要方法及系统

站点导航

APP 下载