摘要
本申请涉及图像处理领域,公开了一种基于多模态大语言模型的智能审图方法及系统,其中方法包括:获取待审查的目标工程设计图纸和审查任务描述;基于目标工程设计图纸生成全局概览图;通过多模态大语言模型根据全局概览图和审查任务描述进行全局语义分析,生成全局语义分析结果和待审查的局部区域提议信息;从设计图纸中裁剪局部图像;通过多模态大语言模型对局部图像进行要素识别解析,得到局部结构化信息;将局部结构化信息和全局语义分析结果进行信息融合处理,生成完整图纸信息后与结构化规范知识库进行合规性校验和缺陷定位,生成审查报告。本申请能够实现对电网工程设计图纸的智能化审查,提高审查效率和准确性,同时降低资源消耗。
技术关键词
工程设计图纸
大语言模型
审图方法
多模态
语义
电网工程设计
空间坐标信息
合规性
结构先验知识
视觉特征编码
报告
副本
多尺度信息
图像处理
人机交互界面
文本
关系
多分辨率
系统为您推荐了相关专利信息
学习路径推荐方法
知识点
大语言模型
同屏显示
对象
异构
局部视觉特征
视频问答方法
音频特征
全局视觉特征
电网设备
运维知识图谱
大语言模型
知识图谱构建
管理系统
人脸识别方法
可见光图像
结构光深度图
结构相似性算法
血管
验光方法
多模态数据融合
虚拟现实界面
波前像差仪
光学补偿器