一种融合图像、文本与BIM模态的施工场景预测方法及装置

正文

推荐专利

申请号：CN202510846123

申请日期：2025-06-24

公开号：CN120411789B

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供的一种融合图像、文本与BIM模态的施工场景预测方法及装置，涉及智慧施工预测管理技术领域。本发明通过提取BIM模型的BIM语义信息构建BIM语义图，结合YOLO模型进行施工现场视频的目标检测识别，得到目标检测结果；并与CLIP跨模态对齐实现图像、文本与BIM的多模态数据深度融合，得到多模态异构图；将多模态异构图输入时空序列模型进行预测，输出未来若干时刻施工场景的预测结果，并动态映射至数字孪生平台，实现风险预警与可视化展示。本申请能够实时捕捉施工动态变化，精准预测施工进度与风险，提升施工管理智能化水平。

技术关键词

场景预测方法语义向量三维建筑模型文本图像 YOLO模型多模态表达式数字孪生异构施工现场碰撞检测算法采样点节点特征坐标矩阵面片

系统为您推荐了相关专利信息

一种基于深度学习的医疗图像增强处理方法及系统

医疗图像数据编码器生成对抗网络图像增强模块解码器

一种基于多模态妇科医患信息实时交互方法及系统

妇科信息实时交互图像特征向量检查图像数据语义

一种机器人的导航方法、机器人及计算机可读存储介质

导航方法分区地图图像可读存储介质

一种多模态长尾数据挖掘方法、系统、车辆及存储介质

数据挖掘方法样本多模态语义参数

一种基于传感数据的房屋整体及周边的在线智慧检测系统

分布式传感器光纤Bragg光栅应变传感器平台模块房屋混合组网技术

一种融合图像、文本与BIM模态的施工场景预测方法及装置

站点导航

APP 下载