一种面向人物和事件的视频描述生成方法

正文

推荐专利

一种面向人物和事件的视频描述生成方法

申请号：CN202510280590

申请日期：2025-03-11

公开号：CN120411842A

公开日期：2025-08-01

类型：发明专利

摘要

本申请提出了一种面向人物和事件的视频描述生成方法，包括：从视频帧中提取人物信息，构建人物库；将视频输入密集视频描述模型，输出视频概述；选取关键帧序列；通过视觉语言模型生成每个关键帧的描述，并根据人物库对每个关键帧进行人脸识别，采用大语言模型将识别到的人物与对应的关键帧描述融合，得到包含人物信息的关键帧描述；采用大语言模型整合视频概述和所有关键帧描述，得到视频描述；基于视频描述构建知识图谱，并判断知识图谱中的实体和关系是否满足设定条件，若不满足，选取新的关键帧序列，并生成对应的视频描述，若满足，确定最终视频描述。采用上述方案的本发明实现了对视频中复杂场景和多人物交互的准确描述。

技术关键词

关键帧大语言模型构建知识图谱视频帧序列人脸识别模型生成方法视觉人脸特征实体三元组生成装置频率模块节点关系场景

系统为您推荐了相关专利信息

网页与客户端软件的交互方法、装置、设备和存储介质

客户端软件通信组件进程传输接口

基于多源数据融合的电力业务数据一张图构建方法和系统

电力业务数据 Java字节码业务系统上下文特征页面

多功能一体化负压护理目标部位的装置及其控制方法

负压腔体臭氧浓度检测仪电场系统校准释放量

一种基于多模态图扩散静态子图的药物相互作用事件预测方法

事件预测方法药物 BERT模型多模态特征融合矩阵

事件抽取与语义信息增强方法及装置

门控循环单元门控神经网络语义 CRF模型标签

一种面向人物和事件的视频描述生成方法

站点导航

APP 下载