一种图像文本描述的生成方法、装置及存储介质

AITNT
正文
推荐专利
一种图像文本描述的生成方法、装置及存储介质
申请号:CN202510142871
申请日期:2025-02-08
公开号:CN120107659A
公开日期:2025-06-06
类型:发明专利
摘要
本说明书公开了一种图像文本描述的生成方法、装置及存储介质,在本说明书提供的图像文本描述的生成方法中,获取待描述图像,对待描述图像进行目标检测,确定待描述图像中包含的图像元素,以及图像元素对应的检测类别。根据图像元素,确定待描述图像的图像描述特征,根据检测类别,确定待描述图像的元素描述特征,将图像描述特征和元素描述特征,输入生成模型,确定待描述图像的文本描述。本方法中待描述图像的图像元素,用于表示待描述图像的细节信息,通过确定视觉模态的图像描述特征和文本模态的元素描述特征,为生成模型提供图像细节的准确语义,进而生成准确的文本描述。
技术关键词
图像 元素 文本 生成方法 节点 标记 序列 处理器 生成装置 语义 可读存储介质 存储器 电子设备 模块 视觉 计算机 数据 编码 算法 程序
系统为您推荐了相关专利信息
1
井下猴车识别模型训练方法、装置及存储介质
井下猴车 识别模型训练方法 卷积模块 原始图像数据 计算机可执行指令
2
电动汽车自动充电装置及其智能控制方法
机械臂基座 充电电动汽车 充电装置 图像采集装置 机械臂运动路径
3
一种血栓栓塞发生风险的评估方法及评估系统
风险评估模型 栓塞 样本 影像 高风险
4
一种面向电网仿真误差溯源的致差区域识别方法
区域识别方法 有功功率 仿真信号 误差 节点
5
使用自适应DIXON技术的具有改进脂肪抑制的用于多回波稳态序列的系统和方法
回波 图像 磁共振扫描仪 处理器可执行代码 磁共振成像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号