一种基于多模态大语言模型的智能审图方法及系统

AITNT
正文
推荐专利
一种基于多模态大语言模型的智能审图方法及系统
申请号:CN202511285694
申请日期:2025-09-10
公开号:CN120783365A
公开日期:2025-10-14
类型:发明专利
摘要
本申请涉及图像处理领域,公开了一种基于多模态大语言模型的智能审图方法及系统,其中方法包括:获取待审查的目标工程设计图纸和审查任务描述;基于目标工程设计图纸生成全局概览图;通过多模态大语言模型根据全局概览图和审查任务描述进行全局语义分析,生成全局语义分析结果和待审查的局部区域提议信息;从设计图纸中裁剪局部图像;通过多模态大语言模型对局部图像进行要素识别解析,得到局部结构化信息;将局部结构化信息和全局语义分析结果进行信息融合处理,生成完整图纸信息后与结构化规范知识库进行合规性校验和缺陷定位,生成审查报告。本申请能够实现对电网工程设计图纸的智能化审查,提高审查效率和准确性,同时降低资源消耗。
技术关键词
工程设计图纸 大语言模型 审图方法 多模态 语义 电网工程设计 空间坐标信息 合规性 结构先验知识 视觉特征编码 报告 副本 多尺度信息 图像处理 人机交互界面 文本 关系 多分辨率
系统为您推荐了相关专利信息
1
学习路径推荐方法及相关装置、设备和存储介质
学习路径推荐方法 知识点 大语言模型 同屏显示 对象
2
一种基于多模态异构图的视听视频问答方法和系统
异构 局部视觉特征 视频问答方法 音频特征 全局视觉特征
3
基于知识联邦与语言模型的电网设备健康管理与运维平台
电网设备 运维知识图谱 大语言模型 知识图谱构建 管理系统
4
基于深度学习的多模态人脸识别方法及系统
人脸识别方法 可见光图像 结构光深度图 结构相似性算法 血管
5
一种用于高精度多型组合的验光方法
验光方法 多模态数据融合 虚拟现实界面 波前像差仪 光学补偿器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号