摘要
本申请公开了一种协同显著性检测方法、产品、设备及存储介质,涉及计算机视觉领域,包括:获取当前待检测的至少两个目标图像,得到当前图像组;将当前图像组输入至训练后的协同显著性检测模型中,以基于预训练语言模型对与当前图像组中各目标图像之间的协同显著性相关的目标文本信息进行提取,并基于目标文本信息引导分割一切模型对当前图像组中的协同显著目标和背景进行分割,得到当前协同显著性检测结果。本申请能够提高对协同显著目标和干扰背景的识别能力,并提升了协同显著性检测的准确性。
技术关键词
协同显著性检测方法
显著性检测模型
关键词特征
预训练语言模型
场景结构
图像特征编码
编码特征
协同注意力
文本特征向量
图像特征向量
图像特征提取
图像编码器
解码
物体
系统为您推荐了相关专利信息
网络安全事件
预训练语言模型
抽取系统
数据
框架
实体
知识图谱补全方法
预训练语言模型
网络适配器
文本
特征提取模型
长短期记忆网络
高端数控装备
预训练语言模型
多模态