摘要
本申请公开了检测模型训练方法、检测方法、设备、存储介质及产品,涉及计算机视觉领域。所述方法包括构建样本数据集;构建可操作区域检测模型,其包括图像分割模块、图像编码器、文本编码器、特征学习模块以及输出模块;图像分割模块对2D图像进行分割,得到图像块;图像编码器对图像块进行特征提取,得到特征向量;文本编码器对可供性标签文本进行特征提取,得到一组可供性标签的词向量;特征学习模块学习每个图像块的特征向量与每个可供性标签的词向量之间的关联关系;输出模块根据关联关系计算可操作区域的概率;利用样本数据集对可操作区域检测模型进行训练和测试。本申请能够实现2D图像中无限数量的可操作区域检测。
技术关键词
检测模型训练方法
文本编码器
图像编码器
区域检测方法
标签文本
输出模块
图像分割
图像块
指令
样本
计算机程序产品
处理器
计算机视觉
关系
数据
可读存储介质
系统为您推荐了相关专利信息
时空融合特征
时序特征
气体识别方法
多源信息融合
注意力机制
图文检索方法
层级
跨模态
文本编码器
图像编码器
知识点标注方法
序列
信息编码器
文本特征向量
BERT模型
盐酸氨溴索
标识
特征值
图像编码器
图像获取模块
多任务处理方法
大语言模型
视觉
非易失性计算机可读存储介质
图像块