Phân biệt Data Table & Lookup Table, Table Relationship & Merger Data

Nội dung được viết bởi Linh Mai

Power BI là phần mềm hỗ trợ phân tích dữ liệu chuyên nghiệp được rất nhiều người ưa chuộng. Nếu các bạn đang sử dụng phần mềm này thì cần phân biệt rõ giữa Data Table & Lookup Table, Table Relationship & Merger Data. Hãy cùng chúng mình tìm hiểu trong bài viết dưới đây nhé.

Phân biệt Data Table & Lookup Table

Khái niệm

Thông thường, trong một data model sẽ có 2 loại bảng: data (hoặc “fact”) tables và lookup (hoặc “dimension”) tables.

  • Data tables là các bảng dữ liệu thường sẽ ở dạng number hoặc value, thông tin thường ở cấp độ đầu tiên, có thể là ID hoặc “key” column dùng để tạo ra các relationships.
  • Lookup tables là các bảng dữ liệu cung cấp thêm các diễn giải để bổ sung thông tin, thường ở dạng text.

Các bạn có thể xem hình ảnh ví dụ dưới đây để thấy được sự khác nhau giữa Data tables và Lookup tables.

Phân biệt Data Table & Lookup Table, Table Relationship & Merger Data

Bảng màu xanh dương, nằm ở bên trái trong hình ảnh trên được gọi là một Data tables vì nó có chứa thông tin dạng number hoặc dạng value. Chúng ta có thể dùng các thông tin này để tạo ra các relationships. 

Ví dụ: Bảng này có bao gồm cột “quantity” và có thể kết nối với lookup tables qua cột “date” và “product_id”.

Hai bảng màu xanh lá và màu cam nằm ở bên phải hình ảnh trên đều là Lookup tables. Trong đó, bảng màu xanh lá là Calendar Lookup table cung cấp thêm các diễn giải, thông tin cần bổ sung cho date (month, year, weekday,…). Bảng màu cam là Product Lookup table cung cấp thông tin bổ sung cho product (brand, product name, sku, price,…).

Xem thêm: Hướng dẫn cách xây dựng Báo cáo, Dashboard trên phần mềm Power BI

Ví dụ thực tế

Bây giờ chúng mình sẽ lấy ví dụ thực tế trong Power BI để các bạn phân biệt được giữa Data tables và Lookup tables. Trước hết, các bạn xem bảng dữ liệu sau:

Phân biệt Data Table & Lookup Table, Table Relationship & Merger Data
  • Bảng Sale Data: Chứa các thông tin dạng số và dạng giá trị như số lượng hàng đã bán, số lượng hàng đặt,… thì đây là một Data table.
  • Bảng Return: Chứa các thông tin về số lượng hàng bị trả lại, ngày tháng,… thì là một Data table.
  • Bảng Products: Chứa các thông tin diễn giải bổ sung cho các sản phẩm bán được trong Sale Data và Return nên trong mối quan hệ với 2 bảng này thì nó là một Lookup table. Trong trường hợp khác, nó vẫn có thể là một Data table nếu có các Lookup table diễn giải chi tiết về các cột thành phần của nó.
  • Bảng Calendar: Bổ sung các thông tin như tên ngày, tháng, tuần trong tháng cho dữ liệu của cột Order Date và Return Date trong 2 Data tables phía trên nên nó được xem là Lookup table.
  • Bảng Customers: Cung cấp thông tin bổ sung về khách hàng nên là một Lookup table.
  • Bảng Product Categories: Cung cấp thông tin bổ sung về sản phẩm nên là một Lookup table.

Xem thêm: 15 mẹo cực hữu ích để tận dụng tối đa chức năng của Microsoft Power BI

Phân biệt Table Relationship & Merger Data

Trước hết, các bạn xem hình ảnh sau đây:

Phân biệt Data Table & Lookup Table, Table Relationship & Merger Data

Thông thường, khi chúng ta muốn bổ sung data và thông tin cho một bảng dữ liệu gốc thì sẽ dùng lookup hoặc hàm RELATED trong Power BI.

Ví dụ: Bảng gốc trong hình ảnh trên có 3 cột là date, product_id, quantity thì chúng ta có thể lookup hoặc sử dụng hàm RELATED để lấy thông tin từ bảng khác và gộp vào bảng này theo chiều dọc bằng công cụ Merger Table. 

Đây là cách khá đơn giản để bổ sung thông tin cho database của chúng ta nhưng lại không hiệu quả bởi vì trong khái niệm về chuẩn hóa database thì Merging Data sẽ tạo ra các data dư thừa, sử dụng khá nhiều bộ nhớ và trình xử lý thông tin của máy tính. 

Còn Relationships là chúng ta tách cả cụm database này thành các bảng. Trong đó, một bảng chứa thông về date, product_id, quantity; một bảng chứa thông tin về calendar (ngày, tháng, quý, năm, thứ trong tuần); một bảng chứa thông tin bổ sung về product (brand, name, sku, weight). Sau đó, chúng ta tạo ra các Relationships là có thể thu được một database với đầy đủ các trường dữ liệu như hình ảnh trên. 

Có thể kết luận rằng sự khác nhau giữa Merging DataRelationships là: 

  • Merging Data: Tạo ra một bảng có chứa rất nhiều dữ liệu.
  • Relationships: Tạo ra mối quan hệ giữa các bảng được tối giản hóa về mặt dữ liệu.

Nếu xét về hiệu quả thì Relationships cho tốc độ xử lý nhanh hơn. Do đó trong Power BI chúng ta thường ưu tiên sử dụng Relationships thay cho Merger Table. 

Xem thêm: Top 4 thủ thuật để giảm kích thước mô hình dữ liệu Power BI

Kết luận

Qua bài viết này, các bạn đã phân biệt được Data Table & Lookup Table, Table Relationship & Merger Data để làm việc với Power BI nhanh chóng và hiệu quả hơn. Nếu các bạn muốn học thêm kiến thức về phân tích dữ liệu với Power BI từ cơ bản đến nâng cao thì hãy nhanh tay đăng ký khóa học:

Khóa học sẽ giúp các bạn hiểu được các khái niệm, thuật ngữ và nguyên tắc cơ bản khi sử dụng Power BI để trực quan hóa dữ liệu. Các bạn cùng được học các kỹ năng để tổng hợp, làm sạch, xử lý dữ liệu. Đồng thời, các bạn cũng rèn luyện được tư duy tiếp cận các vấn đề bằng dữ liệu, hiểu được tầm quan trọng của dữ liệu với các quyết định trong doanh nghiệp. Trong quá trình học, nếu bạn có vấn đề chưa hiểu thì có thể đặt câu hỏi cho giảng viên ngay bên dưới video bài giảng. Mọi thắc mắc đều được giải đáp cặn kẽ, chi tiết. Chúc các bạn luôn học tập hiệu quả!

5/5 - (1 bình chọn)

5/5 - (1 bình chọn)

0 thảo luận

@ 2020 - Bản quyền của Công ty cổ phần công nghệ giáo dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội
Giấy phép mạng xã hội số: 588, cấp bởi Bộ thông tin và truyền thông