摘要
本申请提供一种图像处理方法、服务器、存储介质及程序产品。本申请的方法,通过推理分割模型根据输入图像和查询文本推理预测得到所查询目标对象的常见位置信息和对象特征信息,得到两种不同语义粒度的特征信息;将输入图像编码为图像嵌入,根据目标对象的常见位置信息和图像嵌入进行分割解码处理得到掩码信息,掩码信息包含目标对象在输入图像中的大致位置;根据掩码信息、对象特征信息和图像嵌入进行分割解码处理得到分割结果,通过将目标对象的常见位置信息转换为视觉模态的掩码信息作为掩码提示,将目标对象的对象特征信息作为文本提示,来指导图像分割,可更加精准地定位目标对象在输入图像中的位置,提升分割结果的精准度。
技术关键词
图像嵌入
对象
解码模块
图像编码
文本
图像处理方法
校正模块
预训练模型
样本
计算机执行指令
服务器
处理器
可读存储介质
训练集
计算机程序产品
参数
系统为您推荐了相关专利信息
智能陪伴机器人
人脸表情识别方法
语音采集设备
对象
体态特征