Hướng dẫn 5 cách lọc dữ liệu trùng trong Excel hiệu quả

Nội dung được viết bởi Kim Thu

Dữ liệu bị trùng lặp trên Excel là trường hợp khá phổ biến với người dùng. Nếu những dữ liệu lặp lại này không được xử lý có thể gây sai số trong quá trình tính toán và khiến bảng tính của bạn không được gọn gàng.

Chính vì thế, Gitiho sẽ giới thiệu tới bạn 5 cách lọc dữ liệu trùng trong Excel vô cùng đơn giản và dễ thực hiện. Cùng xem nhé!

Cách lọc dữ liệu trùng trong Excel bằng Remove Duplicates

Remove Duplicates là một tính năng hỗ trợ người dùng xóa các dòng dữ liệu trùng lặp trong Excel. Cách làm vô cùng đơn giản như sau:

Bước 1: Bôi đen vùng dữ liệu cần xóa dữ liệu trùng, vào menu Data > chọn Remove Duplicates trong nhóm Data Tools.

Chức năng Remove Duplicates trong Excel
Chức năng Remove Duplicates trong Excel

Bước 2: Khi này hộp thoại Remove Duplicates sẽ hiện ra, bạn sẽ để những cài đặt như sau:

  • Tích chọn My data has headers nếu bảng dữ liệu của bạn có hàng đầu tiên là tên cột.
  • Tích chọn Select All nếu bạn muốn lọc dữ liệu trùng trên toàn bộ bảng, nếu không muốn thì hãy chọn các cột cụ thể mà bạn muốn lọc.
Hộp thoại Remove Duplicates trong Excel
Hộp thoại Remove Duplicates trong Excel

Bước 3: Bấm vào OK. Lúc này Excel sẽ tiến hành xét các giá trị giống nhau và đưa ra thông báo xóa những giá trị trùng lặp (duplicate values) và còn lại những giá trị duy nhất (unique values).

Xóa các giá trị trùng lặp trong Excel
Xóa các giá trị trùng lặp trong Excel

Lọc trùng với tính năng Conditional Formatting

Tính năng Remove Duplicates có thể hơi rủi ro bởi nó có thể xóa mất dòng dữ liệu mà bạn muốn giữ lại. Chính vì thế, bạn nên dùng Conditional Formatting để đánh dấu giá trị trùng lặp thay vì xóa toàn bộ.

Bước 1: Bôi đen cột dữ liệu muốn lọc, sau đó vào thẻ Home > chọn Conditional Formatting trong nhóm Style > nhấn Highlight Cells Rules > và chọn Duplicates Values.

tính năng Conditional Formatting trong Excel
tính năng Conditional Formatting trong Excel

Bước 2: Hộp thoại Duplicates Values xuất hiện, chọn Duplicate để Excel làm nổi bật giá trị trùng lặp, còn chọn Unique nếu bạn muốn nổi bật giá trị duy nhất.

Ở mục values with chọn màu tô để nổi bật dữ liệu lọc Light Red Fill with Dark Red Text.

Nhấn OK. Kết quả là dữ liệu duy nhất (Unique) hoặc trùng lặp (Duplicate) sẽ được tô màu.

Tô màu các giá trị trùng lặp trong Excel
Tô màu các giá trị trùng lặp trong Excel

Sử dụng Advanced Filter để lọc dữ liệu trùng

Bạn có thể dùng chức năng Advanced Filter tương tự như cách lọc thông thường ở Excel. Những giá trị lọc trùng sẽ vẫn ở đó và không bị mất đi. Các bước làm như sau:

Bước 1: Bôi đen bảng muốn lọc dữ liệu trùng trong Excel, vào thẻ Data > chọn Sort & Filter Advanced.

Tính năng Advanced Filter trong Excel
Tính năng Advanced Filter trong Excel

Bước 2: Đặt các thiết lập trong hộp thoại Advanced Filter vừa hiện ra như sau:

  • Action: tích chọn Filter the list, in-place nếu muốn lọc các dòng giá trị trực tiếp trên vùng dữ liệu đó, và tích Copy to another location nếu muốn copy các giá trị đã lọc sang vị trí khác.
  • List range: là vùng dữ liệu mà bạn muốn lọc.
  • Criteria range: chứa điều kiện lọc theo ý muốn của bạn.
  • Copy to: là vị trí mà bạn muốn copy giá trị lọc sang đó. (cài đặt này chỉ xuất hiện khi bạn chọn Copy to another location)
  • Unique records only: tích chọn mục này để Excel lọc ra các giá trị trùng, giữ lại giá trị duy nhất.
hộp thoại Advanced Filter
hộp thoại Advanced Filter

Bước 3: Nhấn vào OK để hoàn tất. Ta thu được được kết quả sau:

Giá trị duy nhất đã được lọc ra
Giá trị duy nhất đã được lọc ra

Lọc trùng lặp trong Excel với công cụ Pivot Table

Pivot Table có thể khó hiểu đối với những bạn mới học Excel. Tuy nhiên, nếu như bạn biết cách sử dụng công cụ này sẽ tiết kiệm rất nhiều thời gian và các thao tác thực hiện công việc trên Excel.

Bước 1: Bôi đen bảng dữ liệu, vào menu Insert, nhấn vào Pivot Table. 

Công cụ Pivot Table trong Excel
Công cụ Pivot Table trong Excel

Tại hộp thoại Create PivotTable hiện ra: 

  • Hãy kiểm tra lại vùng dữ liệu chọn đã đúng chưa trong mục Table/ Range
  • Tích chọn New Worksheet nếu muốn PivotTable hiện ở sheet mới.
  • Tích chọn Existing Worksheet nếu muốn đặt PivotTable ở vị trí nào đó trong sheet hiện tại.

Sau đó nhấn OK để đóng hộp thoại.

hộp thoại Create PivotTable trong Excel
hộp thoại Create PivotTable trong Excel

Bước 2: Cửa sổ PivotTable Fields hiện ra, hãy kéo cột mà bạn muốn lọc dữ liệu trùng vào ô Rows (ví dụ cột Họ và tên), tiếp tục kéo cột đó vào ô Values và chọn Count trong mục Value Field Settings.

Lọc trùng dữ liệu bằng PivotTable
Lọc trùng dữ liệu bằng PivotTable

Kết quả, PivotTable sẽ đếm số lần xuất hiện từng giá trị trong cột mà bạn muốn lọc. Dòng nào hiện số lớn hơn 1 là giá trị lặp lại.

Số lân các giá trị lặp lại
Số lân các giá trị lặp lại 

Bước 3: Click 2 lần vào giá trị lớn hơn 1 bất kỳ, Excel sẽ hiển thị các giá trị lặp lại cho bạn.

Hiển thị giá trị trùng lặp
Hiển thị giá trị trùng lặp

Pivot Table giúp bạn phân tích dữ liệu và làm các báo cáo trên Excel nhanh và nhàn hơn rất nhiều. Bởi điểm đặc biệt của công cụ này là chúng ta không cần sử dụng công thức Excel mà vẫn có thể tạo được báo cáo trực quan, chuyên nghiệp.

Nếu bạn đang muốn học Excel nâng cao và công cụ Pivottable để nắm được tư duy tạo báo cáo tổng hợp trên Excel, hãy tham khảo ngay khóa học sau tại Gitiho:

Hai nội dung này tương đối gắn kết và bổ sung cho nhau. Nếu những báo cáo có yêu cầu tính toán phức tạp, bạn có thể sử dụng công thức hàm để bổ sung vào Pivottable, hoặc thay vì tạo những báo cáo đơn giản bằng công thức, bạn có thể dùng PivotTable để tính ra kết quả nhanh hơn.

Cách lọc trùng dữ liệu trong 2 sheet trong Excel bằng hàm

Sử dụng công thức hàm giúp bạn lọc dữ liệu trùng ở 2 sheet thay vì 1 sheet như những cách trên. Ta có 2 vùng dữ liệu sau:

lọc dữ liệu trùng ở 2 sheet
lọc dữ liệu trùng ở 2 sheet

Yêu cầu tìm những cái tên bị trùng lặp trong 2 vùng dữ liệu trên.

Cách làm như sau:

Bước 1: Tại sheet 2, thêm một cột Kiểm tra trùng lặp (cột D).

Thêm cột kiểm tra ở sheet 2
Thêm cột kiểm tra ở sheet 2

Bước 2: Nhập công thức sau vào ô D2:

=IF(ISNA(VLOOKUP(A2,Sheet1!A:C,1,0)),"Unique","Duplicate")

Tiếp tục kéo vào sao chép công thức ở cột D2 xuống các ô còn lại. Ta thu được kết quả như sau:

Lọc trùng bằng hàm
Lọc trùng bằng hàm

Kết luận

Như vậy là chúng ta đã hoàn thành 5 cách để lọc dữ liệu trùng trong Excel. Hy vọng chúng sẽ hữu ích trong quá trình làm việc của bạn. Nếu có bất kỳ câu hỏi nào, đừng ngần ngại để lại bình luận để được chuyên gia của Gitiho giải đáp sớm nhất nhé. Chúc bạn thành công!

Khóa học phù hợp với bất kỳ ai đang muốn tìm hiểu lại Excel từ con số 0. Giáo án được Gitiho cùng giảng viên thiết kế phù hợp với công việc thực tế tại doanh nghiệp, bài tập thực hành xuyên suốt khóa kèm đáp án và hướng dẫn giải chi tiết. Tham khảo ngay bên dưới!

/5 - ( bình chọn)

/5 - ( bình chọn)

0 thảo luận

@ 2020 - Bản quyền của Công ty cổ phần công nghệ giáo dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội
Giấy phép mạng xã hội số: 588, cấp bởi Bộ thông tin và truyền thông