摘要
本申请公开了一种基于图像的五元特征检测模型训练方法、系统及设备,该方法包括:获取待训练图像;将待训练图像输入初始模型中,对待训练图像进行视觉特征提取处理,得到待训练图像中每帧待训练图片的初始三元特征;基于初始三元特征进行元素构造,得到初始五元特征;对初始五元特征进行时空聚合处理,得到对应的待训练图片的目标五元特征;确定目标五元特征的预测置信度,并基于预测置信度和目标五元特征对初始模型进行调整,得到目标模型。解决了现有模型输出的二元元素特征关系难以充分体现图像中存在的主体使用工具对对象进行操作的复杂操作关系,降低模型对图片的元素特征关系的识别准确性的问题。
技术关键词
检测模型训练方法
图片
元素
视觉特征提取
预测类别
多尺度特征融合
图像
对象
多头注意力机制
融合特征
关系
特征提取模块
交互动作
处理器
存储器
动态
系统为您推荐了相关专利信息
雷达探测信息
视觉检测方法
视觉特征提取
特征提取网络
多模态特征
图像增强系数
解析方法
功能区域识别
布局
交叉注意力机制
管理货架
销售额
模型训练方法
概率密度函数
业务监控
术语
文本翻译方法
文本翻译系统
光学字符识别技术
翻译装置