找出並標記資料裡的重複行
重複會虛增數量、扭曲報表,而精確匹配又抓不到近似重複。在貼上資料裡標出疑似重複行,讓你在合併前先複核。
重複很少是完全相同的。同一個客戶既是「Acme Inc」又是「Acme Inc.」,同一個聯絡人有兩種略不同的電話格式。普通的「刪除重複項」只抓一模一樣的行,留下那些真正扭曲你數字的雜亂近似項。
這個工具會在貼上資料裡標出疑似重複行,包括精確篩選漏掉的近似項——它會越過那些無關緊要的格式差異。它把這些項浮現出來供複核,而不是刪除任何東西,讓你掌握「什麼算同一條記錄」。
合併決定由你來做,工具只負責把候選項擺到你面前。這既避免了未被發現的重複帶來的虛增數量,也避免了過於激進的自動去重造成的資料丟失。
對應工具
🧹髒資料清洗
清洗貼上的資料 —— 統一格式、糾正拼寫、標記重複 —— 不改動數值。
常見問題
不是完全相同的重複行怎麼找? +
工具會越過無關緊要的格式差異——比如「Acme Inc」對「Acme Inc.」——標出精確匹配漏掉的疑似重複。
它會替我刪除重複嗎? +
不會——它把候選項標出來供複核,由你決定什麼算同一條記錄,避免誤刪資料。
重複為什麼重要? +
它會虛增數量、扭曲報表。抓住近似重複而不只是完全相同的,才能讓你的合計準確。