摘要
本发明公开了一种低成本表格错误检测方法及装置、电子设备、存储介质,包括:获取待检测表格,计算表格中每个单元格值的统计特征、语义特征和错误感知特征,并计算列间相关系数,构建综合特征表示;选择代表数据样本,提示大语言模型生成错误检测指南,对采样样本进行错误标注;通过聚类簇内标签传播,对比提示错误检测规则、错误检测规则与标注数据的相互验证,以及错误样本生成,构建训练数据;设计基于多层感知机的检测器模型,利用训练数据对模型进行训练,对所有单元格值进行检测,得到待检测表格的错误检测结果。本发明无需人工数据标注或错误检测规则定义,可全面检测多种类型的错误,为表格错误检测任务提供了一种低成本的解决方案。
技术关键词
大语言模型
表格
样本
错误检测方法
感知特征
检测器
统计特征
多层感知机
语义特征
代表
数据分布特征
标签
低成本
错误检测装置
文本
基础
随机梯度下降
系统为您推荐了相关专利信息
综合能源系统
负荷预测方法
负荷预测精度
预测误差
吸收式制冷机
图像特征数据
无人机巡查
智能监管方法
图像识别模型
卷积神经网络模型
成绩
网络结构
DBSCAN算法
数据预测方法
代表
电路匹配方法
神经网络模型
阶段
节点特征
晶体管