Power BI là phần mềm hỗ trợ phân tích dữ liệu chuyên nghiệp được rất nhiều người ưa chuộng. Nếu các bạn đang sử dụng phần mềm này thì cần phân biệt rõ giữa Data Table & Lookup Table, Table Relationship & Merger Data. Hãy cùng chúng mình tìm hiểu trong bài viết dưới đây nhé.
Thông thường, trong một data model sẽ có 2 loại bảng: data (hoặc “fact”) tables và lookup (hoặc “dimension”) tables.
Các bạn có thể xem hình ảnh ví dụ dưới đây để thấy được sự khác nhau giữa Data tables và Lookup tables.
Bảng màu xanh dương, nằm ở bên trái trong hình ảnh trên được gọi là một Data tables vì nó có chứa thông tin dạng number hoặc dạng value. Chúng ta có thể dùng các thông tin này để tạo ra các relationships.
Ví dụ: Bảng này có bao gồm cột “quantity” và có thể kết nối với lookup tables qua cột “date” và “product_id”.
Hai bảng màu xanh lá và màu cam nằm ở bên phải hình ảnh trên đều là Lookup tables. Trong đó, bảng màu xanh lá là Calendar Lookup table cung cấp thêm các diễn giải, thông tin cần bổ sung cho date (month, year, weekday,…). Bảng màu cam là Product Lookup table cung cấp thông tin bổ sung cho product (brand, product name, sku, price,…).
Xem thêm: Hướng dẫn cách xây dựng Báo cáo, Dashboard trên phần mềm Power BI
Bây giờ chúng mình sẽ lấy ví dụ thực tế trong Power BI để các bạn phân biệt được giữa Data tables và Lookup tables. Trước hết, các bạn xem bảng dữ liệu sau:
Xem thêm: 15 mẹo cực hữu ích để tận dụng tối đa chức năng của Microsoft Power BI
Trước hết, các bạn xem hình ảnh sau đây:
Thông thường, khi chúng ta muốn bổ sung data và thông tin cho một bảng dữ liệu gốc thì sẽ dùng lookup hoặc hàm RELATED trong Power BI.
Ví dụ: Bảng gốc trong hình ảnh trên có 3 cột là date, product_id, quantity thì chúng ta có thể lookup hoặc sử dụng hàm RELATED để lấy thông tin từ bảng khác và gộp vào bảng này theo chiều dọc bằng công cụ Merger Table.
Đây là cách khá đơn giản để bổ sung thông tin cho database của chúng ta nhưng lại không hiệu quả bởi vì trong khái niệm về chuẩn hóa database thì Merging Data sẽ tạo ra các data dư thừa, sử dụng khá nhiều bộ nhớ và trình xử lý thông tin của máy tính.
Còn Relationships là chúng ta tách cả cụm database này thành các bảng. Trong đó, một bảng chứa thông về date, product_id, quantity; một bảng chứa thông tin về calendar (ngày, tháng, quý, năm, thứ trong tuần); một bảng chứa thông tin bổ sung về product (brand, name, sku, weight). Sau đó, chúng ta tạo ra các Relationships là có thể thu được một database với đầy đủ các trường dữ liệu như hình ảnh trên.
Có thể kết luận rằng sự khác nhau giữa Merging Data và Relationships là:
Nếu xét về hiệu quả thì Relationships cho tốc độ xử lý nhanh hơn. Do đó trong Power BI chúng ta thường ưu tiên sử dụng Relationships thay cho Merger Table.
Xem thêm: Top 4 thủ thuật để giảm kích thước mô hình dữ liệu Power BI
Qua bài viết này, các bạn đã phân biệt được Data Table & Lookup Table, Table Relationship & Merger Data để làm việc với Power BI nhanh chóng và hiệu quả hơn. Nếu các bạn muốn học thêm kiến thức về phân tích dữ liệu với Power BI từ cơ bản đến nâng cao thì hãy nhanh tay đăng ký khóa học:
Khóa học sẽ giúp các bạn hiểu được các khái niệm, thuật ngữ và nguyên tắc cơ bản khi sử dụng Power BI để trực quan hóa dữ liệu. Các bạn cùng được học các kỹ năng để tổng hợp, làm sạch, xử lý dữ liệu. Đồng thời, các bạn cũng rèn luyện được tư duy tiếp cận các vấn đề bằng dữ liệu, hiểu được tầm quan trọng của dữ liệu với các quyết định trong doanh nghiệp. Trong quá trình học, nếu bạn có vấn đề chưa hiểu thì có thể đặt câu hỏi cho giảng viên ngay bên dưới video bài giảng. Mọi thắc mắc đều được giải đáp cặn kẽ, chi tiết. Chúc các bạn luôn học tập hiệu quả!