一种基于语义感知的人物交互检测方法和装置

正文

推荐专利

申请号：CN202510246059

申请日期：2025-03-03

公开号：CN120182997A

公开日期：2025-06-20

类型：发明专利

摘要

一种基于语义感知的人物交互检测方法和装置，该方法提出一种聚焦‑扩散特征增强网络，该网络对提取到的浅、中、深层特征进行尺寸统一，再将每个层次的特征在通道维度上均分，利用激活函数作用于中层特征的值自适应的增强图像的上下文特征或细粒度特征，以改善由复杂的目标种类和背景带来的细粒度目标检测精度低的问题。对于人与物的交互类别多样的问题，提出一种语义感知上下文网络，该网络利用检测出来的类别信息构建语义上下文的文本描述，再通过文本编码器生成词向量，用于表示实例所在区域的上下文特征。再将提取到的图像上下文特征与语义上下文特征执行注意力操作，得到语义感知的上下文特征，从而达到改善多样的交互类别检测不准确的问题。

技术关键词

交互检测方法上下文特征语义 YOLO算法特征提取网络图像文本编码器输出特征双线性插值子模块交互检测装置特征提取模块交叉注意力机制卷积模块细粒度特征识别模块尺寸

系统为您推荐了相关专利信息

一种基于多视图与结构化属性的服装数据集构建方法及其应用

数据集构建方法服装多模态特征视觉表现形式挖掘方法

一种氨燃料动力集装箱船泄漏风险评估方法、装置及设备

集装箱船风险评估方法编码燃料氨气

基于可解释知识捕获的跨主题作文评分方法、装置及介质

作文评分方法编码器主题样本聚类

基于原型学习的弱监督点云实例分割模型训练方法及系统

原型实例分割模型三维点云数据特征提取器多层感知机

一种面向临床试验档案的集成化信息系统及其数据处理方法

数据处理方法实体数据完整性校验电子数据采集系统标识符

一种基于语义感知的人物交互检测方法和装置

站点导航

APP 下载