Nếu bạn muốn xóa các ô trùng lặp (thay vì toàn bộ hàng dữ liệu), bạn có thể thấy tính năng Remove Duplicate Cells đơn giản hơn. Để minh họa cách loại bỏ các hàng trùng lặp trong bảng tính Excel, Gitiho sẽ sử dụng bảng tính ví dụ bên dưới, bảng tính này có dữ liệu kéo dài ba cột.
Nội dung chính
Lệnh Remove Duplicates nằm trong nhóm ' Data Tools' thuộc thẻ Data trên giao diện ribbon của Excel. Để xóa các hàng trùng lặp bằng tính năng Remove Duplicates, bạn thực hiện như sau:
Bước 1: Chọn bất kỳ ô nào trong tập dữ liệu Excel mà bạn muốn xóa các bản sao và bấm nút Remove Duplicates trong nhóm tính năng Data Tools.
Bước 2: Bạn sẽ thấy hộp thoại Remove Duplicates hiển thị như hình dưới đây.
Bước 3: Hộp thoại này cho phép bạn chọn cột nào của tập dữ liệu mà bạn muốn đưa vào so sánh để tìm thông tin trùng lặp. Trong bảng tính ví dụ ở trên, chúng tôi chỉ muốn một bản ghi bị xóa nếu nội dung của cả ba cột chứa thông tin trùng lặp. Do đó, chúng tôi để cả ba trường được chọn trong hộp thoại.
Bước 4: Khi đã đảm bảo rằng các trường bắt buộc đã được chọn trong hộp thoại, hãy bấm nút OK.
Bước 5: Sau đó, Excel sẽ xóa các hàng trùng lặp theo yêu cầu và sẽ hiển thị cho bạn một thông báo, thông báo về số lượng bản ghi đã bị xóa và số lượng bản ghi duy nhất còn lại.
Bảng tính ví dụ kết quả được hiển thị cho thấy, theo yêu cầu hàng trùng lặp 7 (cho Laura CARTER, id: # 31032) đã bị xóa.
Bộ lọc nâng cao của Excel có một tùy chọn cho phép bạn lọc các bản ghi duy nhất (các hàng dữ liệu) trong bảng tính và sao chép danh sách được lọc kết quả sang một vị trí mới.
Điều này cung cấp cho bạn một tập dữ liệu chứa lần xuất hiện đầu tiên của một hàng trùng lặp, nhưng không chứa bất kỳ lần xuất hiện nào khác. Để loại bỏ các hàng trùng lặp bằng Advanced Filter bạn thực hiện như sau:
Bước 1: Chọn dữ liệu mà bạn muốn xóa các bản sao (cột AC trong bảng tính ví dụ ở trên).
(Ngoài ra, nếu bạn chọn bất kỳ ô nào trong tập dữ liệu, Excel sẽ tự động chọn toàn bộ phạm vi dữ liệu khi bạn kích hoạt bộ lọc nâng cao).
Bước 2: Chọn tùy chọn Advanced Filter từ tab Data trên giao diện ribbon. Hoặc trong Excel 2003, tùy chọn này nằm trong menu Data > Filter.
Bước 3: Bạn sẽ thấy một hộp thoại hiển thị các tùy chọn cho bộ lọc nâng cao của Excel.
Bước 4: Trong hộp thoại này:
- Chọn tùy chọn Copy to another location;
- Đảm bảo rằng phạm vi xử lý List range đã được nhập là chính xác;
- Trong trường Copy to, hãy nhập vị trí mà bạn muốn sao chép danh sách mới vào.
Lưu ý rằng vị trí này phải nằm trong trang tính hiện tại. Trong ví dụ này, ô E1 của trang tính hiện tại "Sheet1" đã được chọn làm vị trí Copy to '.
Bước 5: Kích tùy chọn Unique records only rồi bấm nút OK.
Bước 6: Bảng tính kết quả với danh sách dữ liệu mới trong cột E sẽ được hiển thị như hình bên dưới. Bạn có thể thấy rằng hàng trùng lặp 7 (cho Laura CARTER, id: # 31032) đã bị xóa khỏi dữ liệu trong cột EG.
Nếu bạn muốn, có thể xóa các cột ở bên trái danh sách dữ liệu mới của mình (cột AD trong bảng tính mẫu) để trở về định dạng bảng tính ban đầu.
Xem thêm: Sử dụng AutoFilter hiệu quả hơn với VBA
Cảnh báo: Phương pháp này sẽ chỉ hoạt động nếu nội dung ô của bạn có độ dài dưới 256 ký tự, vì các hàm Excel không thể xử lý các chuỗi văn bản dài hơn thế này.
Để minh họa cách sử dụng công thức Excel để loại bỏ các hàng trùng lặp trong bảng tính Excel, chúng tôi sẽ sử dụng lại bảng tính ví dụ đơn giản (lặp lại ở bên phải), chứa dữ liệu cá nhân (họ, tên và số ID) của 9 cá nhân.
Bước đầu tiên để loại bỏ các hàng trùng lặp là kết hợp nội dung của các cột AC thành một cột duy nhất. Sau đó, sẽ đánh dấu các hàng tương ứng với các giá trị trùng lặp, trước khi xóa các hàng này.
Bước 1: Kết hợp các cột
Trước tiên, ôi kết hợp dữ liệu từ các cột AC của bảng tính mẫu, sử dụng toán tử nối & trong cột D. Công thức được nhập vào ô D2 là:
=A2&B2&C2
Sao chép công thức này xuống tất cả các hàng sẽ tạo ra bảng tính sau:
Bước 2: Đánh dấu các hàng trùng lặp
Khi nội dung của cột AC đã được nối vào cột D, chúng ta cần tìm các bản sao trong cột D được kết hợp.
Điều này có thể được thực hiện bằng cách sử dụng hàm COUNTIF, như được hiển thị trong cột E của bảng tính bên dưới. Hàm này hiển thị số lần xuất hiện của mỗi giá trị trong cột D, chỉ cho đến hàng hiện tại .
Như được hiển thị trong thanh công thức của bảng tính trên, định dạng của hàm Countif trong ô E2 là:
= COUNTIF(D$2:D2,D2)
Lưu ý: Chức năng này sử dụng kết hợp tham chiếu ô tuyệt đối và tương đối. Do sự kết hợp của các kiểu tham chiếu này, khi công thức được sao chép xuống cột E, nó sẽ trở thành,
= COUNTIF(D$2:D3,D3)
= COUNTIF(D$2:D4,D4)
= COUNTIF(D$2:D5,D5),
Do đó, công thức trong ô E4 trả về giá trị 1 cho lần xuất hiện đầu tiên của chuỗi văn bản "LauraCARTER # 31032", nhưng công thức trong ô E7 trả về giá trị 2 cho lần xuất hiện thứ hai của chuỗi văn bản này.
Bước 3: Xóa các hàng trùng lặp
Khi chúng ta đã sử dụng hàm COUNTIF để đánh dấu các bản sao trong cột D của bảng tính mẫu, chúng ta cần xóa các hàng có số lượng lớn hơn 1.
Trong bảng tính ví dụ đơn giản, có thể dễ dàng nhìn thấy và xóa hàng trùng lặp duy nhất. Tuy nhiên, nếu bạn có nhiều bản sao, có thể thấy xóa tất cả các bản sao cùng một lúc sẽ nhanh hơn bằng cách sử dụng bộ lọc tự động AutoFilter trong Excel.
Xem thêm: Hướng dẫn cách dùng bộ lọc tự động (AutoFilter) trên Excel
Sử dụng bộ lọc tự động Excel để xóa các hàng trùng lặp
Các bước sau đây cho thấy cách xóa một số hàng trùng lặp cùng một lúc, (sau khi chúng được đánh dấu bằng cách sử dụng hàm COUNTIF).
Bước 1: Chọn cột chứa hàm COUNTIF (cột E trong bảng tính ví dụ ở trên).
(Ngoài ra, nếu bạn chọn bất kỳ ô nào trong tập dữ liệu hiện tại, Excel sẽ tự động chọn toàn bộ dải dữ liệu khi bạn kích hoạt bộ lọc tự động).
Bước 2: Bấm vào nút Filter trong tab Data của bảng tính để áp dụng bộ lọc tự động AutoFilter cho dữ liệu của bạn.
Bước 3: Sử dụng bộ lọc ở đầu cột E để chọn các hàng không bằng 1. Tức là kích vào bộ lọc và từ danh sách các giá trị, bỏ chọn giá trị 1. Bạn sẽ được để lại với một bảng tính trong đó lần xuất hiện đầu tiên của mỗi hàng bị ẩn. Tức là chỉ những hàng trùng lặp được hiển thị.
Bước 4: Bây giờ bạn có thể xóa các hàng này bằng cách đánh dấu chúng, sau đó kích chuột phải và chọn Delete Rows.
Xem thêm: Tìm hiểu cách sử dụng AutoFilter với nhiều điều kiện cùng lúc trong VBA
Bước 5: Loại bỏ bộ lọc và bạn sẽ còn lại với bảng tính được hiển thị bên dưới, trong đó hàng trùng lặp 7 đã bị loại bỏ.
Bước 6: Bây giờ bạn có thể xóa các cột chứa công thức của mình (cột D và E trong bảng tính mẫu), để trở về định dạng bảng tính ban đầu.
Thời đại công nghệ 4.0 đang dần đi vào cuộc sống đòi hỏi mọi người phải tự trang bị kiến thức tin học cho phù hợp để có thể bắt kịp nhưng thay đổi nhanh chóng này. Chẳng ai khác ngoài bạn hiểu mình cần trang bị thêm kiến thức gì. Hãy tìm hiểu ngay TẠI ĐÂY những khóa học hấp dẫn, có tính thực tế cao của Gitiho và đăng ký nhận tư vấn ngay hôm nay.
Khóa học phù hợp với bất kỳ ai đang muốn tìm hiểu lại Excel từ con số 0. Giáo án được Gitiho cùng giảng viên thiết kế phù hợp với công việc thực tế tại doanh nghiệp, bài tập thực hành xuyên suốt khóa kèm đáp án và hướng dẫn giải chi tiết. Tham khảo ngay bên dưới!