图像文本描述的生成方法及装置

正文

推荐专利

图像文本描述的生成方法及装置

申请号：CN202510193712

申请日期：2025-02-21

公开号：CN120355968A

公开日期：2025-07-22

类型：发明专利

摘要

本公开提供了一种图像文本描述的生成方法及装置。该方法包括：利用Transformer和多层感知机构建语义特征提取分支；利用相似度计算公式和注意力机制构建视觉分组网络，利用随机向量生成网络、Transformer、视觉分组网络、Transformer、平均池化层和多层感知机构建视觉分组分支；利用线性层、语义特征提取分支、视觉分组分支、多层感知机和GPT网络构建图像描述生成模型；利用训练图像对图像描述生成模型进行训练，利用训练后的图像描述生成模型生成目标图像的目标文本描述。采用上述技术手段，可以解决现有技术中特征细节信息描述不充分和携带语义信息不足的问题，进而提升生成的文本描述的质量。

技术关键词

语义特征提取多层感知机图像视觉特征分支文本注意力机制生成方法特征融合网络线性可读存储介质处理器生成随机生成装置模块存储器

系统为您推荐了相关专利信息

基于人工智能分析的网络安全实战技能评估方法及系统

技能评估方法日志序列数据库同步节奏特征

一种面向多图像场景的多模态命名实体识别方法及系统

命名实体识别方法命名实体识别系统图像文本注意力机制

语音识别方法、装置、电子设备及计算机可读存储介质

特征提取模型前馈神经网络特征值声学特征语音识别模型

一种基于模型短分支推演的锂电池充电策略样本效率增强方法及系统

充电策略轨迹分支数据样本

一种基于路径重构的半导体加工件智能裁切方法及系统

加工件裁切方法轮廓模型特征点信息边缘轮廓

图像文本描述的生成方法及装置

站点导航

APP 下载