摘要
本发明公开了一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统,包括以下步骤:S1、多源数据采集与预处理:采用无人机与地面设备采集图像/视频数据,对数据进行降噪、增强以及时空对齐处理;S2、改进YOLO目标检测:优化网络结构与训练策略;S3、VLM后链路分析:采用VLM实现目标/场景关联判断;S4、报告生成。本发明通过设置YOLO与VLM融合的水库安全智能巡检方法及系统;利用视觉语言大模型所具备的跨模态语义理解、零样本推理及视频全局分析能力,将其作为YOLO的后处理工具,并与其相互融合并行工作,可实现“目标检测‑语义分析‑报告生成”的全流程智能化,有效解决现有技术问题,增强水利工程安全监测系统的全面性。
技术关键词
智能巡检方法
水库
文本
报告
坝体
视觉
地面设备
Retinex算法
数据采集层
场景
视频
旋翼无人机
多源融合
支持数据存储
模糊综合评价法
RANSAC算法
网络结构优化
后处理工具
智能巡检系统
系统为您推荐了相关专利信息
语音识别功能
显示设备
语音指令识别方法
语义理解模型
声音采集器
糖尿病视网膜病变
检测模型训练方法
图像
样本
通道注意力机制
检测分类模型
文本特征向量
网址
BERT模型
字符
情绪特征
心理健康
AI算法
数据处理方法
语音情绪分析
设备早期故障
编码器
故障检测模型
记录设备
包络