SheetCleaner:在浏览器里把 Excel 去重这件小事做好

一句话版:SheetCleaner 是一款免费、纯前端的 Excel 去重与数据清洗工具。支持 9 种智能去重策略跨 Sheet 合并多工作表独立表头配置,单次可处理约 200 万行全部计算在本地浏览器完成,无需上传文件、无需注册。


为什么做它

真实的表格往往远比“删除重复项”更复杂:
姓名简繁混用、手机号格式各异、SKU 前后缀不统一、多个工作表的表头不一致……传统方法要么不够准,要么非常费时。SheetCleaner 目标就是把这些常见痛点,用一个简单的网页流程解决掉。


核心功能

1) 去重与清洗(9 条规则)

  • 精确匹配(Exact)
  • 多字段联合(如 姓名+手机号)
  • 忽略空值
  • 忽略大小写
  • 去除空白字符(空格、制表符等)
  • 忽略符号/特殊字符(破折号、下划线、括号等)
  • 正则表达式匹配(手机号、身份证、SKU 等自定义规则)
  • 数值容差匹配(支持 ±固定值 / ±%)
  • 跨 Sheet 合并去重(同一工作簿多张表一并处理)

2) 多工作表“表头配置”(新)

同一个工作簿的每个 Sheet 都可以单独指定表头,三种模式

  • 自动检测表头(默认)
  • 手动选择表头行
  • 无表头(按列位置 A/B/C… 处理)
    并可在“字段映射”中把“手机号/电话/mobile”等同义列对齐后再去重。

3) 处理规模与结果

  • 单次约 200 万行(流式分块,取决于内存与列数)
  • 双结果导出:去重后的 主表 + 重复明细表(含匹配理由/触发规则)

隐私与安全(重点)

  • 纯前端架构:所有解析、匹配、导出都在你的浏览器本地进行。
  • 零上传、零存储、零日志:我们不接触你的文件内容;关闭标签页即消失。
  • 可离线使用(PWA 缓存脚本后);前端代码开放,方便审查。

订阅与额度校验仅交换订阅状态与使用配额数字,不传文件或行内容。


3 分钟上手

  1. 打开 sheet-cleaner.com,拖拽 Excel/CSV(或用内置 demo)。
  2. 逐个 Sheet 设置表头模式 → 需要时做字段映射
  3. 勾选去重规则 → 预览 → 下载主表 & 重复明细。

典型场景

  • 营销/运营名单:姓名简繁/空格差异、手机号格式混乱。
  • 电商 SKU/条码:前后缀、符号、大小写不统一。
  • 多分支报表汇总:一个工作簿 10+ 个 Sheet、表头不一致。
  • 财务流水:金额四舍五入误差需要容差合并

版本与定价(当前限时所有版本都免费)

  • Free:≤ 100k 行 / 50MB,9 条规则 & 跨 Sheet,模板 3 个。
  • Pro$20/月(或 $160/年)。单次 ≤ 2M 行 / 200MB,模板不限,跨文件批量(≤10 个),优先计算,后续解锁手机号/邮箱标准化、可调阈值等高级规则。
  • 私有化部署(On-prem):Docker/离线可用,含批处理 API、RBAC、审计日志与可选 SSO,按实例/年授权。

订阅只用于解锁额度与高级功能不改变本地处理的隐私模型


路线图(节选)

  • 模糊匹配(阈值可调)、手机号/邮箱标准化
  • 模板共享与导入、规则建议
  • 跨文件更大规模批处理、CLI/REST API
  • 报错可回溯与性能诊断

常见问答

Q:真的不会把文件传到服务器吗?
A:不会。工具无后端文件上传接口;你可以断网后继续处理(PWA)。

Q:200 万行一定能跑完吗?
A:与列数/浏览器/机器内存相关。超大文件会自动分块并降级处理,建议逐步尝试。

Q:导出的“重复明细表”有什么用?
A:记录每条合并关系与触发的规则/得分,便于审计和复核。


结语

如果你经常在 Excel 里与重复数据“拉锯战”,不妨让 SheetCleaner 帮你把时间还回来:一次配置,反复复用大表也不怕,隐私更安心。欢迎把你的真实数据或需求告诉我们,下一版就为你而改。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐