一种基于图像对比增强的数字教育资源审核模型物体幻觉缓解方法

正文

推荐专利

申请号：CN202510341311

申请日期：2025-03-21

公开号：CN120278266A

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及数字教育资源审核领域，提供一种基于图像对比增强的数字教育资源审核模型物体幻觉缓解方法。该方法利用多模态大语言模型，实现图像与文本的联合审核，通过对输入图像进行预处理和视觉增强，提取关键区域并生成增强图像，然后将原始图像和增强图像分别与文本输入共同送入模型进行推理。通过对比解码生成更准确的审核结果。该方法无需对底层大模型进行额外训练，有效缓解了模型在审核过程中因物体幻觉导致的误判问题，显著提高了数字教育资源审核的准确性和稳定性。

技术关键词

数字教育资源审核模型物体双分支网络校准多模态图像分割算法文本融合视觉大语言模型解码器视觉特征投影机对比度注意力编码器

一种基于图像对比增强的数字教育资源审核模型物体幻觉缓解方法

站点导航

APP 下载