摘要
本发明提供多模态声画存储平台,涉及信息储存技术领域,包括:数据接收模块,用于接收监控中的音频、视频及传感器日志数据,按时间维度分别存储至分布式文件装置、对象存储服务及关系型数据库,构建分布式存储体系;特征提取模块,用于基于分布式存储体系,提取音频的声学特征和视频的视觉特征,并通过时间戳与监控设备的唯一标识码,将同一时空点的音频特征、视频特征及传感器日志标签关联,生成带时空标记的多模态特征组。本发明实现声音与画面多种模态数据的高效整合存储与便捷调用,提升信息管理的全面性、检索的精准性及内容使用的灵活性。
技术关键词
视觉关键词
存储平台
语义向量
分布式文件装置
模态特征
跨模态
视觉特征
对象存储服务
音频
融合语义
分区
多模态
深度学习机制
索引表
关系型数据库
视频
声学特征
系统为您推荐了相关专利信息
驾驶员驾驶状态
车辆行驶状态
车辆预警方法
危险驾驶状态
驾驶员生理状态
模态特征
对象
数据采集设备
能力分析方法
多模态
动态知识图谱
多模态特征
融合特征
交互方法
交互特征
数值
蒙特卡洛树搜索
实体关联关系
增量更新包
职业