一种端到端的动态场景图生成方法及系统

正文

推荐专利

一种端到端的动态场景图生成方法及系统

申请号：CN202511292472

申请日期：2025-09-11

公开号：CN120807734B

公开日期：2025-12-12

类型：发明专利

摘要

本发明涉及一种端到端的动态场景图生成方法及系统，其方法包括提取目标视频中的各个实例的实例特征图；提取各个实例的实例特征图的细粒化特征，得到各个实例的细粒度特征图；预测出与各个实例的细粒度特征图对应的实例描述文本，得到各个实例的实例属性信息；从成对实例查询数据集查询出各个实例之间的成对表示，得到成对实例的边界框坐标信息和类别信息；预测成对实例的动态视觉关系，得到成对实例的动态视觉关系信息；根据成对实例的实例属性信息、边界框坐标信息、类别信息以及动态视觉关系信息生成动态场景图；本发明提高了预测精度的同时还可以实现端到端训练，为动态场景图生成提供了一种新的范式，简化了模型的训练步骤。

技术关键词

动态场景细粒度特征视频帧深度卷积神经网络模型生成数据集生成方法交叉注意力机制预训练模型视觉时序解码器上下文特征关系文本识别模块坐标

系统为您推荐了相关专利信息

一种多角色协同的客服智能体方法

多角色协同音频轨迹自定义参数线性标尺

一种基于三维的电厂作业管理方法

作业管理方法三维模型作业管理系统作业风险预测设备故障

一种基于生成对抗网络的色彩迁移优化方法

迁移优化方法生成对抗网络多层卷积神经网络色彩引入注意力机制

一种用于特种作业实物考场的智能巡检方法及系统

拥堵指数巡检路径巡检设备智能巡检方法动态路径规划

基于多模态数据的护理质量管控系统

管控系统编码向量文本线索语义

一种端到端的动态场景图生成方法及系统

站点导航

APP 下载