图像文本描述的生成方法及装置

AITNT
正文
推荐专利
图像文本描述的生成方法及装置
申请号:CN202510193712
申请日期:2025-02-21
公开号:CN120355968A
公开日期:2025-07-22
类型:发明专利
摘要
本公开提供了一种图像文本描述的生成方法及装置。该方法包括:利用Transformer和多层感知机构建语义特征提取分支;利用相似度计算公式和注意力机制构建视觉分组网络,利用随机向量生成网络、Transformer、视觉分组网络、Transformer、平均池化层和多层感知机构建视觉分组分支;利用线性层、语义特征提取分支、视觉分组分支、多层感知机和GPT网络构建图像描述生成模型;利用训练图像对图像描述生成模型进行训练,利用训练后的图像描述生成模型生成目标图像的目标文本描述。采用上述技术手段,可以解决现有技术中特征细节信息描述不充分和携带语义信息不足的问题,进而提升生成的文本描述的质量。
技术关键词
语义特征提取 多层感知机 图像视觉特征 分支 文本 注意力机制 生成方法 特征融合网络 线性 可读存储介质 处理器 生成随机 生成装置 模块 存储器
系统为您推荐了相关专利信息
1
基于人工智能分析的网络安全实战技能评估方法及系统
技能评估方法 日志 序列 数据库同步 节奏特征
2
一种面向多图像场景的多模态命名实体识别方法及系统
命名实体识别方法 命名实体识别系统 图像 文本 注意力机制
3
语音识别方法、装置、电子设备及计算机可读存储介质
特征提取模型 前馈神经网络 特征值 声学特征 语音识别模型
4
一种基于模型短分支推演的锂电池充电策略样本效率增强方法及系统
充电策略 轨迹 分支 数据 样本
5
一种基于路径重构的半导体加工件智能裁切方法及系统
加工件 裁切方法 轮廓模型 特征点信息 边缘轮廓
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号