一种基于多模态的对比解码幻觉减轻方法、装置及终端

AITNT
正文
推荐专利
一种基于多模态的对比解码幻觉减轻方法、装置及终端
申请号:CN202411463649
申请日期:2024-10-21
公开号:CN118966387B
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开了一种基于多模态的对比解码幻觉减轻方法、装置及终端,方法包括:获取目标初始数据,对所述目标初始数据进行多模态扰动处理,得到目标扰动数据,所述目标初始数据包括目标高清图像及其对应的目标文本提示词;将所述目标初始数据和所述目标扰动数据输入至目标模型,得到初始输出和幻觉输出,所述目标模型为大型视觉语言模型;对所述初始输出和所述幻觉输出进行对比解码,得到目标输出。本发明通过添加多模态的噪声,并将其与初始输出进行对比,从而校准模型的预测,减少生产错误信息的可能性。
技术关键词
超参数 多模态 数据 可读存储介质 文本 图像 高清 视觉特征 高层次 计算机 终端 解码模块 处理器通信 输出模块 程序 指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号