一种面向关联数据集的差异度最大化数据表组合查询方法

AITNT
正文
推荐专利
一种面向关联数据集的差异度最大化数据表组合查询方法
申请号:CN202510202473
申请日期:2025-02-24
公开号:CN120045592A
公开日期:2025-05-27
类型:发明专利
摘要
本发明属于数据检索领域,公开了一种面向关联数据集的差异度最大化数据表组合查询方法,数据处理阶段首先对给定的表格数据集进行数据处理,建立特征‑数据列索引,根据该索引发现表格数据集中的可连接表,同时构建数据表连接图索引,预计算各表格之间的连接信息;数据查询阶段根据给定的样例查询表和连接列集合,在特征‑数据列索引中搜索候选连接列集合,获取候选数据表集合,根据给定预算,选取能够与样例查询表连接,并且使差异度最大的数据表集合。本发明首次提出了在关联数据集中搜索可连接数据表组合的方法,利用特征索引过滤可连接数据表,建立数据表连接图发现数据表之间的的连接路径,并返回预算约束下使差异度最大化的数据表集合。
技术关键词
查询方法 表格 数据 索引 局部敏感哈希 特征提取算法 阶段 列表 唯一性 特征值 顶点 元素 关系
系统为您推荐了相关专利信息
1
信息处理方法、装置、电子设备、存储介质和程序产品
节点 信息处理方法 表格 大语言模型 数据变更信息
2
一种面向能源领域的地图开发引擎及实现方法
空间分析服务 配置工具 地图数据管理 接口 数据可视化
3
市域治理事件处置方法、装置、设备及存储介质
事件处置方法 着色 矩阵 计算机程序指令 处置装置
4
慢行道的路面病害检测方法、设备及存储介质
路面病害检测方法 样本 文本 数据 人工智能技术
5
一种基于多源数据融合的电子对抗效能评估方法
效能评估方法 装备 统计推断方法 数据项 匹配误差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号