.st0{fill:#FFFFFF;}

Hướng dẫn xác định dữ liệu trùng theo nhiều tiêu chí bằng hàm COUNTIFS 

 Tháng Chín 20, 2021

By  Lê Đình Chi

Khi làm việc với dữ liệu lớn, chúng ta thường gặp phải một vấn đề là có những dữ liệu bị trùng, lặp do nhiều nguyên nhân không xác định được.

Yêu cầu của người làm việc với dữ liệu là phải thực hiện việc lọc các giá trị trùng, lặp đó để tránh việc tính toán 2 lần trên 1 nội dung. Tuy nhiên không phải lúc nào việc lọc dữ liệu trùng cũng dễ dàng, bởi căn cứ xác định thế nào là trùng đôi khi lại phức tạp hơn chúng ta vẫn nghĩ.

Ví dụ: Xét bảng dữ liệu sau:

Xác định xem trong bảng dữ liệu trên nội dung ở dòng nào đang bị trùng

Xác định xem trong bảng dữ liệu trên nội dung ở dòng nào đang bị trùng

Yêu cầu: Xác định xem trong bảng dữ liệu trên nội dung ở dòng nào đang bị trùng

Hướng dẫn cách làm:

* Phân tích yêu cầu đề bài

Khảo sát bảng dữ liệu trên, chúng ta thấy rằng: Việc xác định thế nào là trùng ở đây phải căn cứ theo nhiều điều kiện.

  • Ngày: Nếu cùng 1 ngày mà các mặt hàng khác nhau, hoặc số lượng hàng bán khác nhau thì không bị trùng
  • Tên hàng: Nếu cùng 1 tên hàng mà bán ở nhiều ngày khác nhau, hoặc trong cùng 1 ngày nhưng số lượng bán khác nhau sẽ không phải là trùng
  • Số lượng: Nếu số lượng bằng nhau nhưng khác ngày bán, hoặc khác mặt hàng thì không phải trùng.

Để có thể xác định trùng, chúng ta buộc phải xét cùng 1 lúc trên 3 điều kiện trên: Cùng ngày, cùng mặt hàng, cùng số lượng bán thì là trùng

(Ở đây bài toán chỉ có những dữ liệu cho sẵn nên chúng ta chỉ xét trên những nội dung cho sẵn, còn không giả định phức tạp hơn)

* Hàm sử dụng

Yêu cầu xác định dữ liệu trùng -> Chúng ta nghĩ tới hàm Đếm

Yêu cầu bao gồm nhiều điều kiện cùng lúc -> Đếm theo nhiều điều kiện

=> Trong trường hợp này sử dụng hàm COUNTIFS là phù hợp.

* Cách viết hàm

Sau khi đã xác định được hàm phù hợp, chúng ta phải tìm hiểu tiếp 1 bước nữa, đó là xem dùng hàm như thế nào.

Dựa trên việc khảo sát yêu cầu, chúng ta gắn với cấu trúc hàm để biện luận từng nội dung như sau:

Hàm COUNTIFS sẽ viết theo 3 điều kiện:

  • Ngày: Criteria_Range1 là cột Ngày, Criteria1 là ngày tại dòng kiểm tra
  • Tên hàng: Criteria_Range2 là cột Tên hàng, Criteria2 là tên mặt hàng tại dòng kiểm tra
  • Số lượng: Criteria_Range3 là cột Số lượng, Criteria3 là số lượng tại dòng kiểm tra

Chúng ta viết hàm như sau:

G2 = COUNTIFS($A$2:A2,A2,$B$2:B2,B2,$D$2:D2,D2)

Từ ô G2 chúng ta sẽ filldown công thức tới ô G25

* Giải thích: tại sao lại dùng $A$2:A2 chứ không phải $A$2:$A$25

Khi dùng  $A$2:$A$25 thì khi filldown công thức ở cột G, vùng tham chiếu luôn cố định. Vì vậy các giá trị Trùng / lặp sẽ tính = tổng số các giá trị trùng

Khi dùng $A$2:A2  thì khi filldown công thức ở cột G, vùng tham chiếu tăng dần từ A2 tới A25. Vì vậy giá trị Trùng / lặp nếu có xuất hiện sẽ tăng dần theo thứ tự xuất hiện so với vùng dữ liệu trước đó => Chúng ta có thể nhận biết được khi nào giá trị đó chưa bị trùng, khi nào nó bắt đầu bị trùng (Nếu kết quả hàm >1 thì tức là bắt đầu bị trùng)

Tìm hiểu thêm: Tài liệu Excel cơ bản

Chúng ta cùng xem bảng kết quả:

Kết quả tô màu có dòng dữ liệu trùng

Kết quả tô màu có dòng dữ liệu trùng

Trong bảng kết quả trên, mình đã tô màu để chúng ta có thể nhận ra được giá trị trùng.

Kết hợp với phương pháp lọc (Filter) chúng ta hoàn toàn có thể lọc tách các kết quả có giá trị không trùng (giá trị bằng 1 ở cột G) sang một bảng tính khác để lấy riêng ra những giá trị không bị trùng.

Kết luận

Hàm COUNTIFS là một hàm rất mạnh trong excel, ứng dụng trong nhiều trường hợp.

Trong thực tế, chúng ta hầu hết luôn cần kiểm tra dữ liệu trước khi bắt đầu làm việc với dữ liệu nhận được. Do đó thao tác kiểm tra dữ liệu trùng thường là thao tác đầu tiên, giúp chúng ta kiểm tra dữ liệu để đảm bảo tính hiệu quả khi làm việc ở các bước tiếp theo. Các bạn hãy tập luyện thao tác này nhiều để rèn luyện tư duy xử lý dữ liệu trước khi dùng nhé (Giống việc chúng ta phải rửa sạch hoa quả trước khi ăn vậy, nếu không rất dễ bị đau bụng đấy).

Chúc các bạn học tốt cùng zik.vn.

Học Excel tại nhà với các chuyên gia

Đánh giá bài viết này

zik.vn – Nền tảng học online duy nhất tại Việt Nam tập trung vào phát triển kỹ năng làm việc dành cho người đi làm

Với sứ mệnh: Mang cơ hội phát triển kỹ năng, phát triển nghề nghiệp tới hàng triệu người”, đội ngũ phát triển zik.vn đã và đang làm việc với những học viện, trung tâm đào tạo, các chuyên gia đầu ngành để nghiên cứu và xây dựng lên các chương trình đào tạo từ cơ bản đến chuyên sâu xung quanh các lĩnh vực: Tin học văn phòng, Phân tích dữ liệu, Thiết kế, Công nghệ thông tin, Kinh doanh, Marketing, Quản lý dự án…

Zik.vn tự hào khi được đồng hành cùng:

  • 50+ khách hàng doanh nghiệp lớn trong nhiều lĩnh vực như: Vietinbank, Vietcombank, BIDV, VP Bank, TH True Milk, VNPT, FPT Software, Samsung SDIV, Ajinomoto Việt Nam, Messer,…
  • 100.000+ học viên trên khắp Việt Nam

Tìm hiểu ngay các khóa học của Zik.vn TẠI ĐÂY



Lê Đình Chi


Your Signature

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Subscribe to our newsletter now!

DMCA.com Protection Status
>