摘要
本申请的实施例提供了一种基于对比不变风险最小化的场景识别方法、装置、存储介质及电子设备,属于场景识别技术领域。该方法包括步骤:将样本划分至多个环境;获得图像特征和对象感知特征;提取动词不变特征和角色特定特征;对不同环境分别设置动词分类器,并引入不变风险最小化约束与对比学习损失;场景中各实体的识别与定位,生成相应的目标类别与边界框结果;通过训练,对动词分类损失、角色识别损失及辅助损失联合优化。该方法可以有效提升模型对动作识别、名词识别和位置定位的准确性,且具有较好的跨域泛化性能。
技术关键词
感知特征
分类器
场景识别方法
样本
图像
分类损失计算方法
多环境
解码模块
标签
风险
对象
场景识别技术
场景识别装置
交叉注意力机制
编码器
计算机
语义特征
电子设备
实体
系统为您推荐了相关专利信息
影像标注方法
人机协同
语义分割模型
嵌入特征
语义特征
轮胎巡检
工业摄像机
拍照设备
数据特征提取
影像
置信度阈值
后处理方法
车辆自动驾驶系统
列表
索引
数字眼镜
智能巡检方法
可见光图像
数据处理服务器
巡检数据
外观自动检测装置
电机转子
图像处理模块
高速工业相机
控制单元