摘要
本发明公开了一种自适应多表连接基数估计的方法和系统,包括以下步骤:查询训练模型的构建、多表数据的处理、数据的建模、查询信息的获取和多表连接技术的估计。该自适应多表连接基数估计的方法和系统,通过在构建数据模型前对现有的所有表格信息进行转换、筛除、优化和分类,对重复或者不完整的表格进行删除,从而使进行构建数据模型和后续进行训练的数据更加准确,使的进行多表连接基数估计的结果更加精准,此外,通过对表格信息的分类,当输入特征信息时有关的图表信息可以出现与之相匹配的表格,从而减少在进行图表特征提取时花费的时间和精准度,同时进一步提高了多表连接基数估计的精准度。
技术关键词
表格
查询模型
语句
数据模型学习
图表
特征提取模型
模型训练模块
数据抽样
特征提取器
查询方法
编码器
数据分布
采样模块
微处理器
转换器
样本
存储器
系统为您推荐了相关专利信息
代码转换
抽象语法树
程序组织单元
源程序
表达式
知识图谱构建方法
实体
关系
更新知识图谱
知识图谱构建技术
疾病风险预测方法
预训练语言模型
实体
患者
字典数据库