摘要
本发明涉及人工智能技术领域,提供一种基于先验信息的指代图像分割模型训练方法、装置及设备。本发明通过获取样本训练集,根据训练图片和文本指代描述,获取训练图片的先验引导热图,根据多个先验引导热图和样本训练集对初始指代图像分割模型进行训练,并根据预测掩码标注数据、掩码标注数据以及损失函数调整模型的权重参数,直至模型收敛,获取训练完成的指代图像分割模型。由于先验引导热图包含掩码标注数据的先验信息,在通过先验引导热图和样本训练集对模型进行训练过程中,能够使得模型快速关注到指代目标对应的区域,且更好的融合图像细节信息与上下文语义指代信息,提高对训练图片中指代目标的定位的准确性,从而提高了对指代目标的分割效果。
技术关键词
交互特征
图像分割模型
文本
图片
训练集
样本
解码模块
多模态
数据
编码模块
像素点
注意力
人工智能技术
训练装置
参数
视觉
存储器
系统为您推荐了相关专利信息
模式切换控制方法
声纹特征
双通道麦克风
强度
混响时间
冷启动方法
客户端
商品属性信息
语义向量空间
大语言模型
故障检测模型
三维结构
故障案例库
车辆故障检测方法
分析故障原因
图像生成模型
书法图像
风格
样条曲线插补算法
编码器