摘要
本发明涉及人工智能技术领域,提供一种基于先验信息的指代图像分割模型训练方法、装置及设备。本发明通过获取样本训练集,根据训练图片和文本指代描述,获取训练图片的先验引导热图,根据多个先验引导热图和样本训练集对初始指代图像分割模型进行训练,并根据预测掩码标注数据、掩码标注数据以及损失函数调整模型的权重参数,直至模型收敛,获取训练完成的指代图像分割模型。由于先验引导热图包含掩码标注数据的先验信息,在通过先验引导热图和样本训练集对模型进行训练过程中,能够使得模型快速关注到指代目标对应的区域,且更好的融合图像细节信息与上下文语义指代信息,提高对训练图片中指代目标的定位的准确性,从而提高了对指代目标的分割效果。
技术关键词
交互特征
图像分割模型
文本
图片
训练集
样本
解码模块
多模态
数据
编码模块
像素点
注意力
人工智能技术
训练装置
参数
视觉
存储器
系统为您推荐了相关专利信息
数据检索方法
企业
数据检索系统
数据检索技术
界面
AI服务器
智能悬浮
内容推荐方法
服务器集群
复杂度
大语言模型
口碑分析方法
主题关键词
模型优化技术
可视化图表