摘要
本申请实施例提供了一种描述生成模型训练方法、描述生成方法、装置及电子设备,涉及计算机视觉技术领域,描述生成模型训练方法包括:利用第一文本提示以及描述生成模型,对每一第一样本图像进行处理,得到该第一样本图像中指定图像区域的描述文本,作为第一样本描述文本;从各第一样本描述文本中,确定与对应的第一样本图像中指定图像区域相匹配的第二样本描述文本;将每一第二样本描述文本对应的第一样本图像和第一文本提示输入描述生成模型,得到该第一样本图像中指定图像区域的第一预测描述文本;基于第一预测描述文本与第二样本描述文本之间的差异,对描述生成模型的参数进行调整,得到新的描述生成模型。可以准确地生成图像区域的描述文本。
技术关键词
文本
样本
图像编码器
生成模型训练方法
解析器
标记
大语言模型
风格
适配器
参数
生成方法
计算机视觉技术
模型训练装置
模型训练模块
图像获取模块
语句
数据获取模块
电子设备
系统为您推荐了相关专利信息
样本生成方法
混合损失函数
深度学习模型
图像
丢弃方法
信息推荐方法
信息推荐模型
大数据
习惯
信息推荐系统