基于多模态实体对齐的图片描述生成方法

AITNT
正文
推荐专利
基于多模态实体对齐的图片描述生成方法
申请号:CN202510142480
申请日期:2025-02-10
公开号:CN119599014B
公开日期:2025-06-03
类型:发明专利
摘要
本发明涉及一种基于多模态实体对齐的图片描述生成方法,属于图像处理技术领域,解决了现有技术中图像实体描述准确性不高的问题。具体步骤包括:基于包含标注实体后的图像和与其相关文章的第一样本集,训练得到多模态实体对齐模型;基于包含标注描述后的图像和与其相关文章的第二样本集,利用多模态实体对齐模型,得到实体对齐后的候选实体词;基于第二样本集和候选实体词,训练得到基于多模态实体对齐的图像描述生成模型;基于未标注描述的图像和文章,利用多模态实体对齐模型,得到对应的候选实体词,结合未标注描述的图像和文章,利用所述图像描述生成模型,得到图像描述结果,提升了图像实体选择的召回率和精确率。
技术关键词
实体对齐模型 多模态 上下文特征 生成方法 样本 图片 特征提取模块 文章特征 注意力机制 微调方法 词语 多任务 微调技术 图像处理技术 表达式 参数
系统为您推荐了相关专利信息
1
一种基于卫星柱浓度观测反演区域甲烷排放的方法
反演系统 构建高分辨率 卫星观测数据 观测误差 甲烷
2
一种基于孪生神经网络的配电网线变关系诊断方法及系统
孪生神经网络 三元组 关系 诊断方法 编码器参数
3
一种基于多层感知器的超声速客机机翼横流转捩预测方法
超声速客机 转捩预测方法 多层感知器 训练样本集 网格
4
基于区块链的医学课题数据存证方法及医学课题数据存证系统
数据存证方法 医学 数据平台 数据存证系统 存证信息
5
基于大模型的车险业务问答交互方法、装置、介质及设备
报价系统 问答交互方法 样本 人工智能技术 文本识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号