摘要
本发明公开了一种零样本图像文本转换方法及装置,用于解决现有的零样本图像文本转换方法导致生成的输入图像的文本描述的准确度较低的技术问题。方法包括根据获取的文本语料库进行实体表征训练,生成目标实体表征矩阵;采用预置图文对齐表征模型和预置语言处理模型根据文本语料库中的模型训练文本进行训练嵌入提取,生成待训练硬软嵌入;基于预置交叉熵损失函数,根据待训练硬软嵌入对初始解码器模型进行模型训练,确定目标解码器模型;通过预置图文对齐表征模型和预置语言处理模型根据待转换图像和目标实体表征矩阵进行目标嵌入提取,生成目标硬软嵌入;采用目标解码器模型根据目标硬软嵌入进行文本转换,生成待转换图像对应的文本描述。
技术关键词
解码器模型
文本转换方法
实体
图像
图文
矩阵
样本
文本转换装置
计算机程序产品
模型更新
解析器
可读存储介质
解析工具
模块
处理器
计算机设备
存储器
系统为您推荐了相关专利信息
影像分类方法
大语言模型
搜索工具
分类系统
框架
高密度点云
管理方法
摄影图像数据
评估算法
图谱
数字孪生
车间
虚拟三维场景
信息采集单元
图像采集单元