基于视觉对比对齐的可信多模态大模型构建方法及装置

AITNT
正文
推荐专利
基于视觉对比对齐的可信多模态大模型构建方法及装置
申请号:CN202510529737
申请日期:2025-04-25
公开号:CN120046742B
公开日期:2025-07-01
类型:发明专利
摘要
本发明提供一种基于视觉对比对齐的可信多模态大模型构建方法及装置,涉及自然语言处理技术领域。该方法包括:获取文本数据和图片数据;将文本数据和图片数据输入指令微调后的多模态大模型中,获得图片数据对应的偏好响应logit和拒绝响应logit以及无图片对应的偏好响应logit和拒绝响应logit;构建基于视觉对比对齐的可信多模态大模型的框架包括:文本偏好优化模块、差额稳定优化模块、响应级视觉对比对齐模块和标记级视觉对比对齐模块;分别构建每个模块对应的损失函数;根据每个模块对应的损失函数,构建框架的整体损失函数;根据整体损失函数对模型进行训练,获得训练好的多模态大模型。采用本发明可提升多模态大模型的可信度。
技术关键词
视觉 模型构建方法 图片 多模态 对齐模块 sigmoid函数 文本 计算机可读取存储介质 模型构建设备 模型构建装置 标记 计算机可读指令 数据 框架 令牌 参数 自然语言 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号