摘要
本发明公开了一种基于幻觉增强的跨模态检索模型优化方法及系统,包括:类幻觉文本生成模块基于原始训练数据集、语言模型及提示模板生成类幻觉文本;数据集构建模块将类幻觉文本与原始图像‑文本对合并为增强训练数据集;微调优化模块通过图像或文本编码器分别编码图像、原始文本及类幻觉文本特征,计算文本到图像的对比损失和图像到文本的幻觉增强对比损失,结合改进的对比损失函数优化编码适配器与文本编码器的模型参数。本发明解决了智能驾驶场景检索中多模态模型幻觉干扰导致的精度低、效率差问题,通过利用幻觉生成数据增强与动态损失约束,显著提升跨模态检索的准确性。
技术关键词
文本特征向量
图像特征向量
模型优化系统
文本编码器
样本
代表
适配器
图文
智能驾驶场景
模型优化方法
数据
图像编码器
参数
标识符
损失函数优化
跨模态
系统为您推荐了相关专利信息
生成对抗网络模型
特征提取单元
识别器
URL检测方法
字段
粗集料
空隙
计算机程序产品
BP神经网络模型
遗传算法