图像描述文本的生成方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202410796879

申请日期：2024-06-19

公开号：CN118520135A

公开日期：2024-08-20

类型：发明专利

摘要

本公开提供了一种图像描述文本的生成方法，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型技术领域。具体实现方案为：将针对原始图像的视觉处理结果转换为视觉知识文本；根据原始图像以及视觉知识文本，生成原始图像的整图描述文本；根据原始图像的局部图像以及视觉知识文本，生成局部图像的局部描述文本；整合整图描述文本和局部描述文本，得到原始图像的整合描述文本。本公开还提供了一种图像描述文本的生成装置、电子设备和存储介质。

技术关键词

实体图像生成方法文本识别电子设备答案生成装置模块人工智能技术计算机程序产品合并单元计算机视觉处理器通信指令冗余可读存储介质

系统为您推荐了相关专利信息

用于生成图像的方法、装置、计算设备和程序产品

图像生成单元生成提示词计算机程序产品处理器策略

一种基于边缘算法的图像处理方法及系统

边缘算法字符图像处理方法车牌停车场

一种基于极大余弦损失的图像目标检测增量学习方法

增量学习方法样本蒸馏教师标签

一种基于多维度的司法大模型生成效果评价体系构建方法

评价体系构建方法节点拓扑网络文本句法依存关系

一种基于情感识别的跨模态音乐自动生成系统及方法

音乐自动生成方法跨模态多模态情感识别音乐自动生成系统记忆系统

图像描述文本的生成方法、装置、电子设备和存储介质

站点导航

APP 下载