基于多模态大模型灵活关联控制的图像问答方法

AITNT
正文
推荐专利
基于多模态大模型灵活关联控制的图像问答方法
申请号:CN202510201200
申请日期:2025-02-24
公开号:CN119992424A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于多模态大模型灵活关联控制的图像问答方法,首先生成图像和对应文字描述的非关联性特征表示,然后生成图像和定制提示的关联性特征表示,计算每层非关联性特征表示和关联性特征表示的余弦距离,并根据余弦距离筛选得到关键层,对于每个关键层,通过其非关联性特征表示和关联性特征表示计算关联控制向量,在进行图像问答时,在关键层中应用对应的关联控制向量对生成特征表示进行关联控制,从而实现对多模态大模型的创造力和幻觉水平的动态控制。本发明采用灵活关联控制策略,无需额外训练就能高效地动态调节多模态大模型的关联能力,从而解决图像问答任务中的模型幻觉问题,显著增强了图像问答的准确性和创造性。
技术关键词
图像问答方法 多模态 生成特征 生成方法 控制策略 控制权 模板 代表 答案 因子 动态
系统为您推荐了相关专利信息
1
一种向量信号灯控制的单轨多车无人驾驶方法
无人驾驶方法 信号灯 控制策略 轨道 单轨
2
一种基于聚类引导梯度对比学习的多模态空间域鉴定方法
K近邻方法 样本 无监督聚类方法 预训练模型 解码器
3
基于文档数据库的自动驾驶数据集管理系统及方法
数据处理平台 数据采集车 嵌入式数据库 管理方法 可视化模块
4
一种轴承故障模拟方法及系统
故障模拟方法 分布式边缘 轴承刚度 物理 轴承材料
5
图像生成方法、装置、智能体、智能体系统及存储介质
生成方式 图像主体 文本 意图 图像生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号