一种基于微调大语言模型的场景图生成增强方法

正文

推荐专利

申请号：CN202510521522

申请日期：2025-04-24

公开号：CN120450979A

公开日期：2025-08-08

类型：发明专利

摘要

本发明提出了一种基于微调大语言模型的场景图生成增强方法，针对现有的场景图生成算法对不常见目标效果较差的问题，基于数据集标注生成训练数据，对大模型进行指令引导的参数微调，以获得关系预测三元组。该三元组将与传统视觉模型输出的关系三元组集合进行交叉注意力交互，并进行图卷积全局融合得到最终结果。结果表明本发明充分发挥了大语言模型在先验知识和推理能力方面的优势，并与传统视觉模型互补，从而实现更优的表现。

技术关键词

大语言模型三元组联合损失函数场景视觉关系检测模型自然语言问答引入注意力机制节点特征多头注意力机制生成训练数据空间位置关系矩阵编码器指令格式化

系统为您推荐了相关专利信息

企业信贷风险识别的方法、装置和计算机可读存储介质

大语言模型蒙特卡洛金融可读存储介质企业

用于为自动驾驶系统的开发提供数据洞察的方法和系统

数据嵌入传感器生成器网络自动驾驶系统车辆

一种基于线结构光的隧道变形监测方法

隧道变形监测方法深度学习语义分割激光中心线像素

一种基于深度学习的文献协同分析方法及系统

协同分析方法分析事件因子数据库分析技术状态更新

大语言模型的知识注入方法、装置、设备及装存储介质

知识点查询意图大语言模型语句格式

一种基于微调大语言模型的场景图生成增强方法

站点导航

APP 下载