摘要
本发明涉及数据处理技术领域,更具体地,本发明涉及一种用于临床试验EDC系统的数据清洗方法,该方法包括,采集每个类别的各个数据,获取每个类别中每个数据的若干个局部波动程度,根据所述局部波动程度,获取每个类别中每个数据的最优搜索窗口,根据每个类别的每个数据与其最优搜寻窗口左侧数据和右侧数据之间的偏度差异,获取每个类别中每个数据的最终断开概率,根据每个类别中每个数据的最终断开概率,获取每个类别中的各个断点,进而得到每个类别的分箱个数;根据每个类别的分箱个数,构建每个类别的直方图,得到每个类别中每个数据的异常分数,识别异常点,本发明提高了异常检测结果的准确性。
技术关键词
数据清洗方法
异常点
代表
直方图
分箱
断点
数据处理技术
控制权
序列
邻域
变量
算法
参数
系统为您推荐了相关专利信息
智能监管方法
神经协同过滤
住房
智能监管系统
平台
对抗网络模型
图像
人体特征
特征提取算法
直方图均衡化
智能监测系统
感测光缆
卫星通信模块
智能监测方法
数据融合算法
角反射器阵列
阵列设计方法
灰狼优化算法
属性散射中心模型
回波