摘要
本发明涉及一种基于多模态实体对齐的图片描述生成方法,属于图像处理技术领域,解决了现有技术中图像实体描述准确性不高的问题。具体步骤包括:基于包含标注实体后的图像和与其相关文章的第一样本集,训练得到多模态实体对齐模型;基于包含标注描述后的图像和与其相关文章的第二样本集,利用多模态实体对齐模型,得到实体对齐后的候选实体词;基于第二样本集和候选实体词,训练得到基于多模态实体对齐的图像描述生成模型;基于未标注描述的图像和文章,利用多模态实体对齐模型,得到对应的候选实体词,结合未标注描述的图像和文章,利用所述图像描述生成模型,得到图像描述结果,提升了图像实体选择的召回率和精确率。
技术关键词
实体对齐模型
多模态
上下文特征
生成方法
样本
图片
特征提取模块
文章特征
注意力机制
微调方法
词语
多任务
微调技术
图像处理技术
表达式
参数
系统为您推荐了相关专利信息
反演系统
构建高分辨率
卫星观测数据
观测误差
甲烷
超声速客机
转捩预测方法
多层感知器
训练样本集
网格
数据存证方法
医学
数据平台
数据存证系统
存证信息
报价系统
问答交互方法
样本
人工智能技术
文本识别