一种缓解多模态大模型幻觉的训练方法、装置

正文

推荐专利

申请号：CN202510718228

申请日期：2025-05-30

公开号：CN120258071B

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供了一种缓解多模态大模型幻觉的训练方法、装置，涉及多模态大模型训练技术领域，该方法通过重新定义图像标记之间的位置关系，引入二维曼哈顿距离计算，优化了传统一维位置编码的不足，保留了图像的空间局部性特征。同时，通过改进因果注意力掩码，进一步提升了模型对图像与文本信息的融合能力。在模型训练过程中采用冻结预训练模块并逐步微调的策略，显著提高了模型的多模态对齐效果，降低了幻觉现象的发生率，为构建更可靠、更高效的多模态人工智能系统提供了新的技术路径。旨在解决现有技术中多模态大模型因位置编码方式导致的幻觉问题。

技术关键词

多模态图像标记注意力索引坐标多层感知机位置编码技术大语言模型模型训练技术人工智能系统数据令牌分配单元分辨率训练装置转换单元机制矩阵

系统为您推荐了相关专利信息

一种基于注意力机制的视觉自适应方法及系统

注意力机制视频画面视觉深度学习模型

一种基于图像识别的电网设备故障诊断系统及方法

电网设备决策树模型故障诊断系统识别模块故障定位装置

一种基于七目摄像的高尔夫数据检测方法、系统及存储介质

分控制器数据检测方法三维运动轨迹补光灯装置数据采集处理器

一种智能设备数据同步方法及系统

智能设备数据学习机智能手表同步方法面部表情特征

一种基于机器学习的异常数据识别方法和系统

多模态传输路径预警信息发布系统动态环境参数调制编码技术

一种缓解多模态大模型幻觉的训练方法、装置

站点导航

APP 下载