一种图像文本描述的生成方法、装置及存储介质

AITNT
正文
推荐专利
一种图像文本描述的生成方法、装置及存储介质
申请号:CN202510142871
申请日期:2025-02-08
公开号:CN120107659A
公开日期:2025-06-06
类型:发明专利
摘要
本说明书公开了一种图像文本描述的生成方法、装置及存储介质,在本说明书提供的图像文本描述的生成方法中,获取待描述图像,对待描述图像进行目标检测,确定待描述图像中包含的图像元素,以及图像元素对应的检测类别。根据图像元素,确定待描述图像的图像描述特征,根据检测类别,确定待描述图像的元素描述特征,将图像描述特征和元素描述特征,输入生成模型,确定待描述图像的文本描述。本方法中待描述图像的图像元素,用于表示待描述图像的细节信息,通过确定视觉模态的图像描述特征和文本模态的元素描述特征,为生成模型提供图像细节的准确语义,进而生成准确的文本描述。
技术关键词
图像 元素 文本 生成方法 节点 标记 序列 处理器 生成装置 语义 可读存储介质 存储器 电子设备 模块 视觉 计算机 数据 编码 算法 程序
系统为您推荐了相关专利信息
1
一种用于收集大规模IP地址数据的方法及装置
一台计算机 线性时间复杂度 机制 数据 指针
2
网页浏览辅助方法、装置、设备及存储介质
大语言模型 意图 浏览器插件 多媒体 统一资源定位符
3
一种视频帧流处理方法及其系统
关键帧 LSTM模型 对称加密算法 图像 视频帧
4
一种基于相位非均匀量化的穿墙雷达栅瓣抑制方法
栅瓣抑制方法 合成孔径雷达成像 穿墙雷达成像 旁瓣抑制方法 后向投影算法
5
一种基于噪声抑制的相干信号去相干方法
协方差矩阵 噪声抑制 信号去 阵列 MUSIC算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号