一种基于多模态大语言模型的智能审图方法及系统

正文

推荐专利

申请号：CN202511285694

申请日期：2025-09-10

公开号：CN120783365A

公开日期：2025-10-14

类型：发明专利

摘要

本申请涉及图像处理领域，公开了一种基于多模态大语言模型的智能审图方法及系统，其中方法包括：获取待审查的目标工程设计图纸和审查任务描述；基于目标工程设计图纸生成全局概览图；通过多模态大语言模型根据全局概览图和审查任务描述进行全局语义分析，生成全局语义分析结果和待审查的局部区域提议信息；从设计图纸中裁剪局部图像；通过多模态大语言模型对局部图像进行要素识别解析，得到局部结构化信息；将局部结构化信息和全局语义分析结果进行信息融合处理，生成完整图纸信息后与结构化规范知识库进行合规性校验和缺陷定位，生成审查报告。本申请能够实现对电网工程设计图纸的智能化审查，提高审查效率和准确性，同时降低资源消耗。

技术关键词

工程设计图纸大语言模型审图方法多模态语义电网工程设计空间坐标信息合规性结构先验知识视觉特征编码报告副本多尺度信息图像处理人机交互界面文本关系多分辨率

系统为您推荐了相关专利信息

学习路径推荐方法及相关装置、设备和存储介质

学习路径推荐方法知识点大语言模型同屏显示对象

一种基于多模态异构图的视听视频问答方法和系统

异构局部视觉特征视频问答方法音频特征全局视觉特征

基于知识联邦与语言模型的电网设备健康管理与运维平台

电网设备运维知识图谱大语言模型知识图谱构建管理系统

基于深度学习的多模态人脸识别方法及系统

人脸识别方法可见光图像结构光深度图结构相似性算法血管

一种用于高精度多型组合的验光方法

验光方法多模态数据融合虚拟现实界面波前像差仪光学补偿器

一种基于多模态大语言模型的智能审图方法及系统

站点导航

APP 下载