图像描述生成方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510346657

申请日期：2025-03-21

公开号：CN120198915A

公开日期：2025-06-24

类型：发明专利

摘要

本公开提供了图像描述生成方法、装置、设备以及存储介质，涉及人工智能领域，尤其涉及深度学习、智能搜索、计算机视觉领域。具体实现方案为：基于输入图像的第一视觉特征进行检索，得到多模态检索结果；基于该多模态检索结果，得到多维语义特征；基于该第一视觉特征，从该多维语义特征中检索目标语义特征；基于该第一视觉特征和该目标语义特征，生成该输入图像的描述。

技术关键词

视觉特征语义特征检索图像文本多模态数据库补丁多模态特征生成方法多层感知机样本交叉注意力机制模块编码器处理器计算机程序产品计算机视觉

系统为您推荐了相关专利信息

基于知识图谱检索增强的中医处方生成方法与系统

知识图谱构建生成方法病历患者实体

基于机器学习与自然语言处理的寻宠地理信息匹配方法

语义特征地理信息匹配方法地图界面动态滑动条控件

一种数据处理方法和数据处理系统

数据处理方法智能调控方法智能调控系统加权融合算法数据项

文本分类方法、装置、介质及计算机设备

标签文本文本分类方法计算机设备文本分类技术文本分类装置

一种载人飞行器用定位着陆方法

着陆方法动态障碍物视觉特征信息双目摄像头载人飞行器技术

图像描述生成方法、装置、设备以及存储介质

站点导航

APP 下载