图像描述方法、装置、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202411446380

申请日期：2024-10-16

公开号：CN119339378A

公开日期：2025-01-21

类型：发明专利

摘要

本申请公开了一种图像描述方法、装置、设备及计算机可读存储介质，本申请涉及人工智能技术领域，该方法包括：基于预设的待描述特征对原始图像数据进行描述，得到初始描述文本，其中，初始描述文本表征所述原始图像数据中待描述特征对应的描述信息；从预设的五感法维度上对初始描述文本进行语义增强处理，得到增强描述文本，其中，五感法维度包括视觉维度、触觉维度、听觉维度、味觉维度和嗅觉维度；基于初始描述文本和增强描述文本生成原始图像数据的综合描述信息。本申请能够提升多模态大模型在跨模态生成任务中的性能。

技术关键词

原始图像数据文本语义可读存储介质自然语言理解图文听觉大语言模型人工智能技术指令计算机视觉处理器关系多模态基础存储器

系统为您推荐了相关专利信息

一种沙箱在线调试方法、装置、设备及存储介质

在线调试方法展示平台接口沙箱编程

话单数据的处理方法、装置、设备、存储介质及程序产品

资源格式对象号码无监督学习

一种多轴数控铣床自动编程系统

刀具路径多轴数控铣床自动编程系统后处理模块关联关系分析

教学互动抢答定位方法、装置、计算机设备及存储介质

定位方法短时傅里叶变换关键帧计算机可读指令教学

轮式机器人通信网络动态负载均衡方法、装置及设备

轮式机器人动态负载均衡方法 QoS指标动态负载均衡装置实时通信

图像描述方法、装置、设备及计算机可读存储介质

站点导航

APP 下载