一种基于解码引导的大语言模型多模态推理方法和装置

AITNT
正文
推荐专利
一种基于解码引导的大语言模型多模态推理方法和装置
申请号:CN202510620717
申请日期:2025-05-14
公开号:CN120633830A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供了一种基于解码引导的大语言模型多模态推理方法和装置,属于自然语言处理领域,该方法包括:基于目标问题及对应的目标图像生成图片描述,并根据图片描述将目标问题解构为子问题集合;遍历子问题集合,采用集束搜索解码算法生成回答,得到对应于每个子问题的多个候选子答案,计算置信度,确定置信度最高的候选子答案为子问题对应的子答案;基于子问题‑子答案对构建多模态推理提示,输入至大语言模型进行推理,得到推理答案。这样,缓解了多模态大模型的错误累积,增强了大模型推理时对有误视觉信息的鲁棒性,保障了视觉信息的准确性,有效提升最终的推理效果,无需人力构建训练数据集,大大降低了推理学习的成本。
技术关键词
多模态 推理方法 答案 大语言模型 图片 解码算法 序列 规划 集束 推理装置 图像 处理器 自然语言 计算机设备 可读存储介质 视觉 存储器 鲁棒性 模块
系统为您推荐了相关专利信息
1
高精度定位支撑的高安全性场景驱动决策控制一体化自动驾驶系统
自动驾驶系统 数据安全监测 智能网联汽车 云端 平台
2
一种家用低噪音蜗壳的智能检测方法及系统
数字孪生模型 智能检测方法 蜗壳 深度学习模型 振动特征
3
基于多模态机器学习的二次交流回路绝缘监视方法及系统
多模态机器学习 绝缘监视方法 局部线性嵌入算法 分析信息系统 支持向量机算法
4
基于伪点云特征优化的相机多模态融合3D目标检测方法
点云特征 多模态特征融合 图像 相机 解码器
5
基于边缘计算的纸制品包装缺陷实时检测系统
实时检测系统 纸制品 包装 压电驱动微定位平台 深度强化学习
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号