摘要
本发明公开了一种基于Web的数据挖掘方法及系统,涉及数据处理技术领域,该方法包括:对Web数据源集合包括的各个Web数据源进行信息价值评分,以识别和选择信息价值评分大于价值评分阈值的参考Web数据源;根据参考Web数据源中数据的数据模态,将参考Web数据源中的数据划分到多个数据块集合中;根据多个数据块集合中数据的内容类型、结构与属性,将多个数据块集合中的数据划分为多个结构子块;基于每个数据块集合对应的多个结构子块,创建多模态数据融合框架;基于多模态数据融合框架,对多个数据块集合进行融合,以提取跨模态特征;将提取得到的跨模态特征映射到一个共同的特征空间;以及基于共同的特征空间中的跨模态特征,执行数据挖掘任务。
技术关键词
多模态数据融合
数据挖掘系统
模态特征
数据挖掘方法
跨模态
音视频
脱敏策略
框架
链接结构
生成用户定制
文本
统计特征
模块
视频流
二进制特征
文件头信息
音频
节点
图像
系统为您推荐了相关专利信息
场景识别方法
特征融合网络
点云特征提取
描述符
图像特征提取
施工场所
动态三维模型
工程施工管理系统
施工工具
指数
光谱图像分类方法
前馈神经网络
多模态特征
注意力机制
多层感知器
融合神经网络
搜索算法优化
辨识方法
电力系统
门控循环单元
数据挖掘系统
数据挖掘方法
分布式数据库
动态更新
语义标签