一种基于微调大语言模型的场景图生成增强方法

AITNT
正文
推荐专利
一种基于微调大语言模型的场景图生成增强方法
申请号:CN202510521522
申请日期:2025-04-24
公开号:CN120450979A
公开日期:2025-08-08
类型:发明专利
摘要
本发明提出了一种基于微调大语言模型的场景图生成增强方法,针对现有的场景图生成算法对不常见目标效果较差的问题,基于数据集标注生成训练数据,对大模型进行指令引导的参数微调,以获得关系预测三元组。该三元组将与传统视觉模型输出的关系三元组集合进行交叉注意力交互,并进行图卷积全局融合得到最终结果。结果表明本发明充分发挥了大语言模型在先验知识和推理能力方面的优势,并与传统视觉模型互补,从而实现更优的表现。
技术关键词
大语言模型 三元组 联合损失函数 场景 视觉关系检测模型 自然语言问答 引入注意力机制 节点特征 多头注意力机制 生成训练数据 空间位置关系 矩阵 编码器 指令 格式化
系统为您推荐了相关专利信息
1
企业信贷风险识别的方法、装置和计算机可读存储介质
大语言模型 蒙特卡洛 金融 可读存储介质 企业
2
用于为自动驾驶系统的开发提供数据洞察的方法和系统
数据嵌入 传感器 生成器网络 自动驾驶系统 车辆
3
一种基于线结构光的隧道变形监测方法
隧道变形监测方法 深度学习语义分割 激光 中心线 像素
4
一种基于深度学习的文献协同分析方法及系统
协同分析方法 分析事件 因子 数据库分析技术 状态更新
5
大语言模型的知识注入方法、装置、设备及装存储介质
知识点 查询意图 大语言模型 语句 格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号