一种基于异构图的多模态教学视频摘要生成方法

正文

推荐专利

申请号：CN202511340793

申请日期：2025-09-19

公开号：CN120833575B

公开日期：2025-12-02

类型：发明专利

摘要

本发明公开了一种基于异构图的多模态教学视频摘要生成方法，包括：获取若干个视频样本形成训练集；建立多模态摘要生成模型并利用训练集训练，模型执行如下操作：分别将视频帧序列和句子序列输入视觉特征提取模型和语言模型，得到视觉特征向量集合和文本特征向量集合形成多模态特征表示；初始化邻接矩阵；将模态内约束矩阵、模态间约束矩阵、邻接矩阵进行哈达玛积，获得优化异构图；执行双阶段融合策略；利用训练好的多模态摘要生成模型输出的多模态统一表示筛选关键视频帧节点集合和关键句子节点集合，并对应保留在优化异构图内的连接关系作为子邻接矩阵，获得多模态摘要图。该方法可生成语义一致、内容丰富的教学视频摘要，泛化能力强。

技术关键词

视频摘要生成方法视频帧节点三元组样本文本特征向量联合损失函数异构矩阵多模态特征语义关系注意力锚点视觉特征提取教学元素

系统为您推荐了相关专利信息

一种基于数据驱动的动力透平优化方法及系统

神经网络预测模型工况参数 GAN模型流场特征三维模型

集成人工智能技术的数据库综合治理系统及其方法

综合治理方法人工智能技术智能探针决策综合治理系统

一种基于神经网络优化的快速热屏蔽超材料及其设计方法

热屏蔽人工神经网络模型屏蔽超材料稳态曲线

银行开户流程的预测方法、装置、存储介质和电子设备

节点特征数据 LightGBM模型 XGBoost模型可读存储介质

一种基于数据潮流映射的配电网未知量测信息补全方法

信息补全方法数据驱动模型数据补全技术故障诊断系统配电网系统

一种基于异构图的多模态教学视频摘要生成方法

站点导航

APP 下载