摘要
本发明公开了一种基于多模态特征融合的通用场景检索分析方法及系统,所述方法包括视频分析步骤和应用服务步骤,所述应用服务步骤包括接收用户输入请求,基于所述视频概要描述与多维度标准化视频标签,能够执行跨模态视频检索、动态知识增强问答以及交互式增强分析步骤,本发明通过构建离线特征库实现高效视频预处理,采用跨模态特征融合技术提升检索精度,结合动态知识库增强分析权威性,并支持交互式增强分析实现异常预警,具有提升离线视频处理效率、实现跨模态特征融合检索、增强分析结果权威性的优点。
技术关键词
多模态特征融合
检索分析系统
检索分析方法
视频分析
视觉问答模型
跨模态
欧氏距离算法
场景
图像
清洗算法
语义标签
特征融合技术
增强子
子模块
离线
动态
答案
系统为您推荐了相关专利信息
设计优化方法
纺织品
数字孪生模型
设备运行参数
材料特性参数
监控分析方法
深度学习模型
视觉特征
文本
视频监控分析系统
复合层合结构
冲击定位方法
协同注意力
注意力机制
信号
接管方法
环境感知信息
智能驾驶系统
车辆运动状态
决策