Trong bài viết này chúng ta sẽ cùng phần biệt hai loại Table thường thấy trong PowerBI là Data Table và Lookup Tables. Bên cạnh đó, nội dung bài viết cũng sẽ đề cập tới Table Relationship và Merged Data để xem giữa hai công cụ này, công cụ nào sẽ thân thiện cho người dùng trong việc kết nối Data
Data Model thông thường bao gồm 2 loại bảng: data (hoặc "fact") và Lookup (hoặc "Dimension"). Ngoài ra ta còn cần lưu ý sau:
- Data table thường dạng number hoặc value. Thông thường ở cấp độ đầu tiên, với ID or "key" column có thể sử dụng để tạo ra các relationships
- Lookup Table cung cấp thêm các diễn giải, để bổ sung thông tin, thường dưới dạng Text
Ví dụ, dưới đây là một bảng Data Table bởi bảng này có chứa những thông tin dưới dạng Number, Value. Từ đó sử dụng các thông tin này để tạo ra các Relationship
Còn hai bảng còn lại được gọi là Lookup Table vì sẽ có những thông tin bổ sung cho một thông tin nào đó trong Data Table. Với bảng màu xanh lá cây sẽ Lookup Table cho cột Date. Từ đó phần Date trong Data Table sẽ được diễn giải ra qua nhiều góc nhìn như day_of_month (Ngày trong tháng), thứ, ngày, tháng, năm, thuộc quý mấy
Bảng màu cam còn lại cũng là một Lookup Table bổ sung cho Product ID, Nó cũng sẽ diễn giải ra Product ID này sẽ có tên thương hiệu (product_brand), tên sản phẩm (product_name), giá bán, giá vốn, trọng tải. Vậy nên Lookup Table rất quan trọng để chúng ta hiểu được khái niệm ngay từ đầu để các phần tiếp theo khi chúng ta sử dụng lại thì sẽ không mất công phải tìm hiểu từ đầu
Tóm gọn lại:
- Data Table là những bảng dữ liệu dưới dạng Number hoặc Value và cấp độ thông tin ở mức độ đầu tiên.
- Lookup Table là phần cung cấp thêm các diễn giải thông tin bổ sung để cho cột nào đó trong Data Table
Xem thêm: Hướng dẫn thao tác Edit table sửa bảng cơ bản trong Power BI
Ví dụ với bảng Sale Data dưới đấy có những thông tin thường ở dạng Number và Value, chẳng hạn như OrderNumber, OrderQuantity,... thì rõ ràng những thông tin như thế này sẽ theo Data Table
Mục Return sẽ chứa thông tin hàng bị trả lại, đồng nghĩa sẽ cũng được thêm vào Data Table
Phần Product sẽ chứa thông tin diễn giải bổ sung cho Sale Data cho cụm dữ liệu này, vậy nên Product là một Lookup Table cho trường Sale Data và Sale Return. Nhưng cũng cần lưu ý rằng trong những Relationship này thì là Lookup Table, nhưng ở mối quan hệ khác thì nó sẽ lại là Data Table.
Xem thêm: Hướng dẫn tạo biểu đồ đường kẻ kết hợp cột liên cụm (Line and Clustered Column Chart) trong Power BI
Ví dụ, trường Product là Data Table thì trong đó có các Lookup Table khác diễn giải chi tiết Product Color có những đặc tính nào thì đó là Lookup Table cho Product. Còn trong các Relationship khác thì trường Product là Lookup Table.
Tương tự thì Calendar là một Lookup Table vì nó bổ sung các thông tin như ngày, tháng,.. cho cột Order Date hay Return Date trong Data Table
Cột Customer cũng tương tự khi nó cung cấp các thông tin bổ sung cho khách hàng, do vậy nó sẽ đóng vai trò là Lookup Table.
Còn Product Categories thì sẽ cung cấp thông tin bổ sung cho trường Product, dó đó nó cũng là một Lookup Table.
Như vậy trong 6 bảng này chỉ có Sale Data và Return Data là dạng Data Table, còn 4 bảng còn lại là Product, Calendar, Customer và Product Categories là những Lookup Table
Mẹo: Các bảng chứa dữ liệu số (Number) thường là Data Table, còn những bảng chứa thông tin bổ sung thì sẽ là Lookup Table
Còn Relationship sẽ tách cả cụm Database thành ba bảng gồm Date, Quantity, Quality, bảng còn lại sẽ chứa thông tin về Calendar bao gồm thứ, ngày, tháng, năm, quý và một bảng chứa thông tin về Product Lookup (Thêm một số thông tin cho phần Product ID như brand, name,..). Từ đó tạo ra các Relationship để được các Database với các trường dữ liệu liên kết với nhau.
Về bản chất thì nó vẫn là dạng liên kết dữ liệu, nhưng khác nhau về mục đích sử dụng. Nếu Merged Table tạo ra nhiều dữ liệu thì Table Relationship sẽ tạo ra các mỗi quan hệ giữa các bảng chứa dữ liệu. Và về mặt hiệu quả thì Relationship cho tốc độ nhanh hơn, do vậy đó chính là ưu tiên khi chúng ta sử dụng PowerBI thay cho Merged Table
Bởi vậy chúng ta nên xem xét giữa Table Relationship và Merged Tables cái nào tối ưu hơn trong từng trường hợp cụ thể khi sử dụng PBI
Xem thêm: Cách thêm Index và Conditional Column khi xử lý dữ liệu với PowerBI
Trên đây là hai khái niệm mà chúng ta cần phân biệt khi tạo ra Data Model. Thứ nhất là sự khác nhau giữa Data Table và Lookup Table. Thứ hai là Relationship và Merged Table và lí do tại sao chúng ta sử dụng Relationship trong Data Model chứ không sử dụng Merged Table trong Data Model. Hy vọng bạn đọc sẽ áp dụng được những kiến thức này vào công việc của mình.
Tài liệu kèm theo bài viết
Bạn có thể nhanh chóng biến dữ liệu thô thành báo cáo trực quan sinh động, từ đó dễ dàng đưa ra quyết định thông minh, nhanh chóng, kịp thời nhờ Power BI. Khám phá công cụ tuyệt vời này ngay với khóa học “PBIG01 - Tuyệt đỉnh Power BI - Thành thạo trực quan hóa và Phân tích dữ liệu” tại Gitiho. Nhấn vào Đăng ký và Học thử ngay nhé!