摘要
本申请公开了一种报表文件相似性检测方法、设备及介质,方法包括:读取excel格式的待检测报表文件;提取待检测报表文件的表头字段,根据UTF‑8编码对表头字段进行排序;根据排序的表头字段,将待检测报表文件与目标文件列表中的目标报表文件进行相似度计算;目标文件列表中不具有相同的目标报表文件;判断是否具有相似度大于或等于预设相似阈值的目标报表文件;在不具有时,将待检测报表文件存储至目标文件列表;在具有时,将待检测报表文件存储至重复文件列表。能够更高效准确地对报表文件进行相似性检测。
技术关键词
报表
文件相似性检测方法
列表
表头
字段
计算机可执行指令
智能模型
文件存储路径
处理器通信
检测设备
格式
存储器
编码
客户端
介质
字符
标记
系统为您推荐了相关专利信息
一体化管理系统
总控平台
计算机终端显示器
数据分析模块
数据处理模块
联合分析方法
原始测序数据
DNA序列特征
基因
因子