摘要
本发明公开了一种复杂表格数据错误检测方法,包括:获取复杂表格数据样本;构建逻辑分组模块、联合表征模块、特殊对采样模块和逆倾向分数修正的分类器模块;逻辑分组模块基于距离相关系数对属性列进行逻辑分组,将最有可能存在上下文语义关系的属性列划分到一组内;联合表征模块加强各个分组内特征向量的上下文逻辑关系的表征能力;基于簇内平方和函数与bce‑rerank模型的特殊对采样模块能在少量标注实例的情况下准确定位到最具信息量的特例数据对;基于逆倾向分数修正的分类器模块旨在消除采样过程中的选择偏差问题;将表格数据标注样本输入上述错误检测模型进行处理,得到最终的错误检测结果。
技术关键词
数据错误检测方法
表格
分类器
矩阵
采样模块
数据标签
数据库查询接口
样本
DBSCAN算法
错误检测装置
错误检测模块
人脸图像数据
逻辑
多视角
计算机
拼接模块
注意力机制
系统为您推荐了相关专利信息
轨道交通隧道
数据集构建方法
稠密点云
稠密深度图
稀疏深度图
燃气轮机
状态优化方法
稳态模型
数据
计算机程序代码
数字视频监控系统
异常检测方法
矩阵
镜头边界检测
文本编码器