基于多模态实体对齐的图片描述生成方法

正文

推荐专利

基于多模态实体对齐的图片描述生成方法

申请号：CN202510142480

申请日期：2025-02-10

公开号：CN119599014B

公开日期：2025-06-03

类型：发明专利

摘要

本发明涉及一种基于多模态实体对齐的图片描述生成方法，属于图像处理技术领域，解决了现有技术中图像实体描述准确性不高的问题。具体步骤包括：基于包含标注实体后的图像和与其相关文章的第一样本集，训练得到多模态实体对齐模型；基于包含标注描述后的图像和与其相关文章的第二样本集，利用多模态实体对齐模型，得到实体对齐后的候选实体词；基于第二样本集和候选实体词，训练得到基于多模态实体对齐的图像描述生成模型；基于未标注描述的图像和文章，利用多模态实体对齐模型，得到对应的候选实体词，结合未标注描述的图像和文章，利用所述图像描述生成模型，得到图像描述结果，提升了图像实体选择的召回率和精确率。

技术关键词

实体对齐模型多模态上下文特征生成方法样本图片特征提取模块文章特征注意力机制微调方法词语多任务微调技术图像处理技术表达式参数

系统为您推荐了相关专利信息

一种基于卫星柱浓度观测反演区域甲烷排放的方法

反演系统构建高分辨率卫星观测数据观测误差甲烷

一种基于孪生神经网络的配电网线变关系诊断方法及系统

孪生神经网络三元组关系诊断方法编码器参数

一种基于多层感知器的超声速客机机翼横流转捩预测方法

超声速客机转捩预测方法多层感知器训练样本集网格

基于区块链的医学课题数据存证方法及医学课题数据存证系统

数据存证方法医学数据平台数据存证系统存证信息

基于大模型的车险业务问答交互方法、装置、介质及设备

报价系统问答交互方法样本人工智能技术文本识别

基于多模态实体对齐的图片描述生成方法

站点导航

APP 下载