摘要
本发明提供了一种Excel多表连续重复数据处理系统及方法,属于电子表格自动化技术领域。该方法通过预处理清除原始表单元格背景色;采用滑动窗口算法(窗口长度N≥5)遍历多表相同Sheet,检测行或列方向上连续重复的数值、文本或公式;基于重复来源差异化标记颜色(同Sheet标记黄色,跨Sheet标记红色,支持RGB自定义);通过图片缩放、灰度转换及哈希值比对实现重复图片去重,并依据原坐标参数定位至新表;最终生成保留原表合并单元格、边框样式、字体格式及公式结构的新Excel文件。本发明攻克了连续重复区域检测缺失、图片冗余存储及结构迁移失真三大技术难题,显著提升数据处理效率与精度,适用于金融审计、供应链管理及科学研究等多领域复杂场景。
技术关键词
重复数据处理方法
数据处理系统
滑动窗口算法
图片
支持用户自定义
标记
颜色
Excel表
哈希算法
合并单元格
格式
输出模块
唯一性
字体
重复性
样式
文本
参数
系统为您推荐了相关专利信息
发动机缸盖罩
铝合金压铸件
空间结构
控制系统
成品
方位识别方法
物体检测模型
车辆
非易失性计算机可读存储介质
车灯
交互模型
交互方法
机器可读指令
电子设备
处理器