一下午硬刚 12 个 Sheet + 100 万行,我拉着 AI 写了个纯前端Excel去重工具
摘要:SheetCleaner是一款纯前端的Excel数据清洗工具,支持9种智能去重策略(如忽略大小写、符号、数值容差等),单次可处理约200万行数据,完全在浏览器本地运行,无需上传文件。特色功能包括跨Sheet合并、多工作表独立表头配置、双结果导出(主表+重复明细表)。工具主打隐私安全,所有计算在本地完成,可离线使用(PWA)。提供免费版(10万行)和Pro版(200万行),适用于营销名单、电商
SheetCleaner:在浏览器里把 Excel 去重这件小事做好
一句话版:SheetCleaner 是一款免费、纯前端的 Excel 去重与数据清洗工具。支持 9 种智能去重策略、跨 Sheet 合并、多工作表独立表头配置,单次可处理约 200 万行,全部计算在本地浏览器完成,无需上传文件、无需注册。
为什么做它
真实的表格往往远比“删除重复项”更复杂:
姓名简繁混用、手机号格式各异、SKU 前后缀不统一、多个工作表的表头不一致……传统方法要么不够准,要么非常费时。SheetCleaner 目标就是把这些常见痛点,用一个简单的网页流程解决掉。
核心功能
1) 去重与清洗(9 条规则)
- 精确匹配(Exact)
- 多字段联合(如 姓名+手机号)
- 忽略空值
- 忽略大小写
- 去除空白字符(空格、制表符等)
- 忽略符号/特殊字符(破折号、下划线、括号等)
- 正则表达式匹配(手机号、身份证、SKU 等自定义规则)
- 数值容差匹配(支持 ±固定值 / ±%)
- 跨 Sheet 合并去重(同一工作簿多张表一并处理)
2) 多工作表“表头配置”(新)
同一个工作簿的每个 Sheet 都可以单独指定表头,三种模式:
- 自动检测表头(默认)
- 手动选择表头行
- 无表头(按列位置 A/B/C… 处理)
并可在“字段映射”中把“手机号/电话/mobile”等同义列对齐后再去重。
3) 处理规模与结果
- 单次约 200 万行(流式分块,取决于内存与列数)
- 双结果导出:去重后的 主表 + 重复明细表(含匹配理由/触发规则)
隐私与安全(重点)
- 纯前端架构:所有解析、匹配、导出都在你的浏览器本地进行。
- 零上传、零存储、零日志:我们不接触你的文件内容;关闭标签页即消失。
- 可离线使用(PWA 缓存脚本后);前端代码开放,方便审查。
订阅与额度校验仅交换订阅状态与使用配额数字,不传文件或行内容。
3 分钟上手
- 打开 sheet-cleaner.com,拖拽 Excel/CSV(或用内置 demo)。
- 逐个 Sheet 设置表头模式 → 需要时做字段映射。
- 勾选去重规则 → 预览 → 下载主表 & 重复明细。
典型场景
- 营销/运营名单:姓名简繁/空格差异、手机号格式混乱。
- 电商 SKU/条码:前后缀、符号、大小写不统一。
- 多分支报表汇总:一个工作簿 10+ 个 Sheet、表头不一致。
- 财务流水:金额四舍五入误差需要容差合并。
版本与定价(当前限时所有版本都免费)
- Free:≤ 100k 行 / 50MB,9 条规则 & 跨 Sheet,模板 3 个。
- Pro:$20/月(或 $160/年)。单次 ≤ 2M 行 / 200MB,模板不限,跨文件批量(≤10 个),优先计算,后续解锁手机号/邮箱标准化、可调阈值等高级规则。
- 私有化部署(On-prem):Docker/离线可用,含批处理 API、RBAC、审计日志与可选 SSO,按实例/年授权。
订阅只用于解锁额度与高级功能,不改变本地处理的隐私模型。
路线图(节选)
- 模糊匹配(阈值可调)、手机号/邮箱标准化
- 模板共享与导入、规则建议
- 跨文件更大规模批处理、CLI/REST API
- 报错可回溯与性能诊断
常见问答
Q:真的不会把文件传到服务器吗?
A:不会。工具无后端文件上传接口;你可以断网后继续处理(PWA)。
Q:200 万行一定能跑完吗?
A:与列数/浏览器/机器内存相关。超大文件会自动分块并降级处理,建议逐步尝试。
Q:导出的“重复明细表”有什么用?
A:记录每条合并关系与触发的规则/得分,便于审计和复核。
结语
如果你经常在 Excel 里与重复数据“拉锯战”,不妨让 SheetCleaner 帮你把时间还回来:一次配置,反复复用;大表也不怕,隐私更安心。欢迎把你的真实数据或需求告诉我们,下一版就为你而改。
更多推荐


所有评论(0)