摘要
本说明书公开了一种图像文本描述的生成方法、装置及存储介质,在本说明书提供的图像文本描述的生成方法中,获取待描述图像,对待描述图像进行目标检测,确定待描述图像中包含的图像元素,以及图像元素对应的检测类别。根据图像元素,确定待描述图像的图像描述特征,根据检测类别,确定待描述图像的元素描述特征,将图像描述特征和元素描述特征,输入生成模型,确定待描述图像的文本描述。本方法中待描述图像的图像元素,用于表示待描述图像的细节信息,通过确定视觉模态的图像描述特征和文本模态的元素描述特征,为生成模型提供图像细节的准确语义,进而生成准确的文本描述。
技术关键词
图像
元素
文本
生成方法
节点
标记
序列
处理器
生成装置
语义
可读存储介质
存储器
电子设备
模块
视觉
计算机
数据
编码
算法
程序
系统为您推荐了相关专利信息
井下猴车
识别模型训练方法
卷积模块
原始图像数据
计算机可执行指令
机械臂基座
充电电动汽车
充电装置
图像采集装置
机械臂运动路径
回波
图像
磁共振扫描仪
处理器可执行代码
磁共振成像数据