一种缓解多模态大模型幻觉的训练方法、装置

AITNT
正文
推荐专利
一种缓解多模态大模型幻觉的训练方法、装置
申请号:CN202510718228
申请日期:2025-05-30
公开号:CN120258071B
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供了一种缓解多模态大模型幻觉的训练方法、装置,涉及多模态大模型训练技术领域,该方法通过重新定义图像标记之间的位置关系,引入二维曼哈顿距离计算,优化了传统一维位置编码的不足,保留了图像的空间局部性特征。同时,通过改进因果注意力掩码,进一步提升了模型对图像与文本信息的融合能力。在模型训练过程中采用冻结预训练模块并逐步微调的策略,显著提高了模型的多模态对齐效果,降低了幻觉现象的发生率,为构建更可靠、更高效的多模态人工智能系统提供了新的技术路径。旨在解决现有技术中多模态大模型因位置编码方式导致的幻觉问题。
技术关键词
多模态 图像 标记 注意力 索引 坐标 多层感知机 位置编码技术 大语言模型 模型训练技术 人工智能系统 数据 令牌 分配单元 分辨率 训练装置 转换单元 机制 矩阵
系统为您推荐了相关专利信息
1
一种基于注意力机制的视觉自适应方法及系统
注意力机制 视频 画面 视觉 深度学习模型
2
一种基于图像识别的电网设备故障诊断系统及方法
电网设备 决策树模型 故障诊断系统 识别模块 故障定位装置
3
一种基于七目摄像的高尔夫数据检测方法、系统及存储介质
分控制器 数据检测方法 三维运动轨迹 补光灯装置 数据采集处理器
4
一种智能设备数据同步方法及系统
智能设备数据 学习机 智能手表 同步方法 面部表情特征
5
一种基于机器学习的异常数据识别方法和系统
多模态 传输路径 预警信息发布系统 动态环境参数 调制编码技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号