一种图像描述方法及装置

AITNT
正文
推荐专利
一种图像描述方法及装置
申请号:CN202510544005
申请日期:2025-04-27
公开号:CN120492946A
公开日期:2025-08-15
类型:发明专利
摘要
本申请公开了一种图像描述方法及装置,其中,所述方法包括:获取图像和文本指令;将所述图像和所述文本指令输入图像描述模型进行推理,得到所述图像对应的文本描述信息,其中,通过比对所述图像经过所述图像描述模型中视觉编码器输出的视觉编码,和所述图像经过所述图像描述模型中所述视觉编码器、投影层和大语言模型输出的文本描述信息,得到所述视觉编码与所述文本描述信息之间的相似度,基于所述相似度调整所述图像描述模型的参数。
技术关键词
文本编码器 参数 多模态 大语言模型 图像编码器 预训练模型 适配器 指令 数据 词语 语句 模块
系统为您推荐了相关专利信息
1
一种基于智能数据分析的就业匹配方法以及系统
协作平台 团队 博弈优化算法 职业 多模态
2
预防下肢血栓智能训练方法及相关装置
预防下肢血栓 智能训练方法 多轴惯性传感器 运动训练 生物反馈传感器
3
一种基于面部运动单元的表情智能生成方法及系统
面部运动单元 智能生成方法 表情模型 生成表情动画 矩阵
4
两级特征压缩机器学习通信网络性能的预测分析方法及系统
机器学习模型 预测分析方法 性能预测模型 性能指标数据 元素
5
基于空洞卷积与一致性学习的精神状态数据分类预测系统
时序特征 预测系统 数据分类 空间特征提取 医学影像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号