一种细粒度语义感知辅助边界定位的视频密集描述方法

正文

推荐专利

申请号：CN202411588661

申请日期：2024-11-08

公开号：CN119478785A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供了一种细粒度语义感知辅助边界定位的视频密集描述方法，包括有以下步骤:步骤一：进行特征提取和编码；步骤二：构建事件编码模块；步骤三：语义感知增强的事件解码；步骤四：损失函数优化；通过将解码器视为一个多头预测任务来克服仅采用事件起止时间作为直接监督信息，而致使在定位和描述这两个阶段之间仅产生有限相关性的问题；并在此基础上，针对这种有限相关性问题在边界过度平滑的情况下，定位更加困难的不足，还提出通过在框架中引入语言语义感知信息来增强模型有效学习前背景之间差异性特征，以增加边界感知能力来解决由于过度平滑导致定位不清的问题，提高了学习噪声事件实例鲁棒特征的能力，实现更精准定位。

技术关键词

损失函数优化视频语义层面事件特征视觉特征文本生成器编码模块跨模态鲁棒特征噪声事件序列多尺度特征解码器解码模块输出特征语句矩阵定位头

系统为您推荐了相关专利信息

一种无人塔机架设系统及其方法

无人塔机环境感知系统动力供应系统远程监控系统架设系统

一种车用集成式DMS装置

摄像头镜片车用视频传输接口车辆驾驶监控技术补光灯

奖励模型训练方法、智能体训练方法、目标物选址方法及其装置、存储介质

智能体训练方法模型训练方法样本选址方法状态更新

特征提取方法、装置、计算机设备及存储介质

特征提取方法功能成像特征提取模型特征提取网络积层

基于人工智能的景区拍照方法及装置

主题景区拍照方法模板人工智能算法纪念品

一种细粒度语义感知辅助边界定位的视频密集描述方法

站点导航

APP 下载