Gitiho Learning 3
Gitiho Learning 3
Thảo luận 0 thảo luận
Vỗ tay 0 vỗ tay
Lượt xem 241 lượt xem

Phân biệt Data Table và Lookup Table, Table Relationship và Merged Data

Gitiho Learning 3
Gitiho Learning 3
Apr 27 2021

Trong bài viết này chúng ta sẽ cùng phần biệt hai loại Table thường thấy trong PowerBI là Data Table và Lookup Tables. Bên cạnh đó, nội dung bài viết cũng sẽ đề cập tới Table Relationship và Merged Data để xem giữa hai công cụ này, công cụ nào sẽ thân thiện cho người dùng trong việc kết nối Data

PBIG01 - Thành thạo Microsoft PowerBI để Trực quan hóa và Phân tích dữ liệu

Tổng quan về Data Table và Lookup Table

Data Model thông thường bao gồm 2 loại bảng: data (hoặc "fact") và Lookup (hoặc "Dimension"). Ngoài ra ta còn cần lưu ý sau:
- Data table thường dạng number hoặc value. Thông thường ở cấp độ đầu tiên, với ID or "key" column có thể sử dụng để tạo ra các relationships

- Lookup Table cung cấp thêm các diễn giải, để bổ sung thông tin, thường dưới dạng Text 
Ví dụ, dưới đây là một bảng Data Table bởi bảng này có chứa những thông tin dưới dạng Number, Value. Từ đó sử dụng các thông tin này để tạo ra các Relationship


Còn hai bảng còn lại được gọi là Lookup Table vì sẽ có những thông tin bổ sung cho một thông tin nào đó trong Data Table. Với bảng màu xanh lá cây sẽ Lookup Table cho cột Date. Từ đó phần Date trong Data Table sẽ được diễn giải ra qua nhiều góc nhìn như day_of_month (Ngày trong tháng), thứ, ngày, tháng, năm, thuộc quý mấy

Bảng màu cam còn lại cũng là một Lookup Table bổ sung cho Product ID, Nó cũng sẽ diễn giải ra Product ID này sẽ có tên thương hiệu (product_brand), tên sản phẩm (product_name), giá bán, giá vốn, trọng tải. Vậy nên Lookup Table rất quan trọng để chúng ta hiểu được khái niệm ngay từ đầu để các phần tiếp theo khi chúng ta sử dụng lại thì sẽ không mất công phải tìm hiểu từ đầu 

Tóm gọn lại:

- Data Table là những bảng dữ liệu dưới dạng Number hoặc Value và cấp độ thông tin ở mức độ đầu tiên

- Lookup Table là phần cung cấp thêm các diễn giải thông tin bổ sung để cho cột nào đó trong Data Table

Đọc thêm: Hướng dẫn thao tác Edit table sửa bảng cơ bản trong Power BI

Thực hành phân biệt Data Table và Lookup Table 

Cách sử dụng Data Table

Ví dụ với bảng Sale Data dưới đấy có  những thông tin thường ở dạng Number và Value, chẳng hạn như OrderNumber, OrderQuantity,... thì rõ ràng những thông tin như thế này sẽ theo Data Table

Mục Return sẽ chứa thông tin hàng bị trả lại, đồng nghĩa sẽ cũng được thêm vào Data Table

Đọc thêm: Hướng dẫn tạo biểu đồ đường kẻ kết hợp cột liên cụm (Line and Clustered Column Chart) trong Power BI

Phần Product sẽ chứa thông tin diễn giải bổ sung cho Sale Data cho cụm dữ liệu này, vậy nên Product là một Lookup Table cho trường Sale Data và Sale Return. Nhưng cũng cần lưu ý rằng trong những Relationship này thì là Lookup Table, nhưng ở mối quan hệ khác thì nó sẽ lại là Data Table 

Cách sử dụng Lookup Table

Ví dụ, trường Product là Data Table thì trong đó có các Lookup Table khác diễn giải chi tiết Product Color có những đặc tính nào thì đó là Lookup Table cho Product. Còn trong các Relationship khác thì trường Product là Lookup Table      

Tương tự thì Calendar là một Lookup Table vì nó bổ sung các thông tin như ngày, tháng,.. cho cột Order Date hay Return Date trong Data Table

Cột Customer cũng tương tự khi nó cung cấp các thông tin bổ sung cho khách hàng, do vậy nó sẽ đóng vai trò là Lookup Table 

Còn Product Categories thì sẽ cung cấp thông tin bổ sung cho trường Product, dó đó nó cũng là một Lookup Table.

Như vậy trong 6 bảng này chỉ có Sale Data và Return Data là dạng Data Table, còn 4 bảng còn lại là Product, Calendar, Customer và Product Categories là những Lookup Table

Mẹo: Các bảng chứa dữ liệu số (Number) thường là Data Table, còn những bảng chứa thông tin bổ sung thì sẽ là Lookup Table

Phân biệt Relationship Table và Merged Table

Ứng dụng của Relationship Table

Nếu chúng ta muốn bổ sung Data, bổ sung thông tin cho một dữ liệu gốc thì thông thường chúng ta sử dụng Lookup hoặc Related để có thể lấy thông tin từ bảng khác rồi gộp lại theo chiều dọc bằng công cụ Merged Table mà chúng ta đã tìm hiểu ở phần trước

Cách này về bản chất người dùng sử dụng được bình thường để bổ sung thêm Data cho Database. Tuy nhiên cách này thì không hiệu quả vì trong khái niệm Nomarlization Database (Chuẩn hóa Database) thì Merging Data sẽ tạo ra các Data thừa và sử dụng đáng kể các bộ nhớ và trình xử lý thông itn của máy tính hơn là tạo ra các Relationship

Đọc thêm: Cách thêm Index và Conditional Column khi xử lý dữ liệu với PowerBI

Ứng dụng của Merged Table

Còn Relationship sẽ tách cả cụm Database thành ba bảng gồm Date, Quantity, Quality, bảng còn lại sẽ chứa thông tin về Calendar bao gồm thứ, ngày, tháng, năm, quý và một bảng chứa thông tin về Product Lookup (Thêm một số thông tin cho phần Product ID như brand, name,..). Từ đó tạo ra các Relationship để được các Database với các trường dữ liệu liên kết với nhau. 

Về bản chất thì nó vẫn là dạng liên kết dữ liệu, nhưng khác nhau về mục đích sử dụng. Nếu Merged Table tạo ra nhiều dữ liệu thì Table Relationship sẽ tạo ra các mỗi quan hệ giữa các bảng chứa dữ liệu. Và về mặt hiệu quả thì Relationship cho tốc độ nhanh hơn, do vậy đó chính là ưu tiên khi chúng ta sử dụng PowerBI thay cho Merged Table

Bởi vậy chúng ta nên xem xét giữa Table Relationship và Merged Tables cái nào tối ưu hơn trong từng trường hợp cụ thể khi sử dụng PBI

Trên đây là hai khái niệm mà chúng ta cần phân biệt khi tạo ra Data Model. Thứ nhất là sự khác nhau giữa Data Table và Lookup Table. Thứ hai là Relationship và Merged Table và lí do tại sao chúng ta sử dụng Relationship trong Data Model chứ không sử dụng Merged Table trong Data Model. Hy vọng bạn đọc sẽ áp dụng được những kiến thức này vào công việc của mình.

Đọc thêm:

Tải miễn phí Ebook: Kể chuyện qua dữ liệu

HƯỚNG DẪN CÁCH SỬ DỤNG HÀM MROUND TRONG POWER BI DAX

Cách sử dụng trang tính Google làm nguồn dữ liệu cho Power BI

DÂN VĂN PHÒNG LÀM POWER BI, GOOGLE DATA STUDIO CÓ THỂ LẤY DỮ LIỆU TỪ MỌI NGUỒN DATABASE (CSDL) MÀ KHÔNG CẦN IT

11 Công cụ trực quan hóa dữ liệu tốt nhất hiện nay (Cập nhật 2021)

Tài liệu kèm theo bài viết

Gitiho.com Nền tảng học online dành cho người đi làm duy nhất tại Việt Nam cam kết hỗ trợ học viên 24/7

Với sứ mệnh: “Mang cơ hội phát triển kỹ năng, phát triển nghề nghiệp tới hàng triệu người”, đội ngũ phát triển Gitiho.com đã và đang làm việc với những học viện, trung tâm đào tạo, các chuyên gia đầu ngành để nghiên cứu và xây dựng lên các chương trình đào tạo từ cơ bản đến chuyên sâu xung quanh các lĩnh vực: Tin học văn phòng, Phân tích dữ liệu, Thiết kế, Công nghệ thông tin, Kinh doanh, Marketing, Quản lý dự án...
Gitiho tự hào khi được đồng hành cùng:
  • 50+ khách hàng doanh nghiệp lớn trong nhiều lĩnh vực như: Vietinbank, Vietcombank, BIDV, VP Bank, TH True Milk, VNPT, FPT Software, Samsung SDIV, Ajinomoto Việt Nam, Messer,…
  • 100.000+ học viên trên khắp Việt Nam

Nếu bạn quan tâm đến các kiến thức về phân tích dữ liệu, hãy truy cập ngay TẠI ĐÂY và tìm cho mình khóa học phù hợp nhé!



Thảo luận 0 câu trả lời
Lượt xem 241 lượt xem
Vỗ tay vỗ tay

0 Bình luận

@ 2020 - Bản quyền của Công ty TNHH Công Nghệ Giáo Dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội