基于双关系时间对齐与自适应区域优化方法与系统

AITNT
正文
推荐专利
基于双关系时间对齐与自适应区域优化方法与系统
申请号:CN202511030631
申请日期:2025-07-25
公开号:CN120526437B
公开日期:2025-09-12
类型:发明专利
摘要
本发明提出一种基于双关系时间对齐与自适应区域优化方法与系统,该方法包括:获取视频与问题提示文本,利用视觉编码器对视频进行特征提取以得到视觉特征,利用文本编码器对问题提示文本进行特征提取以得到文本特征,将视觉特征进行全局平均池化处理,并与文本特征进行余弦相似度计算,以得到每一帧的视觉特征表示与文本特征的相关性得分的集合,根据每一帧的视觉特征表示与文本特征的相关性得分进行筛选,以得到高相关帧集合与中等相关帧集合。本发明引入一种动态空间采样模块,从与提示相关的热力图候选区域中提取最大连通区域,以消除分散干扰,增强空间特征表达的紧凑性,从而极大减小了空间噪声的干扰。
技术关键词
视觉特征 感兴趣 文本编码器 全局平均池化 关键帧 热力图 采样模块 关系 跨度 视频特征向量 坐标 答案 特征提取模块 序列 图像 采样器 算法 动态
系统为您推荐了相关专利信息
1
路径生成方法、系统、电子设备、存储介质及车辆
路径生成方法 校验信息 激光雷达 车辆 轨迹
2
一种基于改进轻量化YOLOv8模型的夜间红外检测方法及系统
红外检测方法 模块 图像多尺度 特征提取能力 红外图像特征
3
一种基于改进卷积神经网络的人员闯入检测方法
闯入检测方法 权重模型 动态 关键点 全局平均池化
4
一种三维数据合成方法、电子设备、存储介质及程序产品
三维网格模型 语义 数据 局部纹理特征 随机噪声
5
基于集中视觉处理中心的遥感目标检测方法
金字塔结构 检测头 高层语义信息 计算机视觉技术 全局平均池化
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号