摘要
本发明公开了一种基于云边端架构的开集目标检测方法、装置和设备,涉及视觉语言检测技术领域。云端服务器可获取边缘设备上传的用户输入的文本并提取文本中的语言特征,然后基于预设类别表进行分类映射,以判断文本中所描述的类别是否都出现在预设类别表中,若存在新类别,则获取边缘设备对用户输入的图像提取得到的视觉特征,从而对语言特征和视觉特征进行特征融合得到视觉语言特征编码,并根据视觉语言特征编码确定图像中对应于文本的待检测目标并将其发送至边缘设备。若不存在新类别,则使边缘设备根据用户输入的图像确定对应预设类别表中至少部分类别的待检测目标。本发明提高了开集目标检测在云边端架构的实际场景中的实用性。
技术关键词
视觉特征
文本
图像检测模型
融合器
注意力
云端服务器
解码器
样本
多层感知机
模块
编码
融合特征
广义
语言检测技术
偏差
卷积网络模型
指令
系统为您推荐了相关专利信息
智能识别方法
多尺度
输出特征
二维离散小波变换
注意力
单体电池
电压传感器
电流传感器
环境传感器
长短期记忆网络
视频检测方法
天然气
归一化模块
组合模块
注意力机制
混合预测模型
空调运行参数
时序特征
混合损失函数
预测系统