摘要
本申请涉及图像数据处理技术领域,公开了一种用于电网图纸的多模态大模型审图优化方法及系统,其中方法包括:构建电网逻辑图谱;通过多模态大语言模型对目标图纸进行视觉识别,定位并识别出目标设备,生成视觉识别结果;将目标设备与电网逻辑图谱中逻辑节点进行关联,生成逻辑锚定结果;基于逻辑锚定结果查询电网逻辑图谱,获取与目标设备具有逻辑关联的关联设备的设备信息;根据关联设备的设备信息,预测并生成下一个待审查的视觉焦点区域;通过多模态大语言模型对待审查的视觉焦点区域进行识别与校验,得到对应的审查结果。本申请能够实现基于设备逻辑关系的动态焦点转移,优化电网图纸审图路径,提高审图的智能化程度和缺陷识别能力。
技术关键词
视觉焦点区域
逻辑
大语言模型
图谱
图纸
多模态
图像数据处理技术
节点
电网设备
文本
跨模态
策略
检查故障
视觉设备
参数
语句
标识符
视觉特征
系统为您推荐了相关专利信息
大语言模型
案件
知识图谱构建
生成知识图谱
实体
模型库构建方法
刀具状态监测
工况
推理机制
实体