Nội dung chính
Bài viết này Gitiho.com sẽ cùng bạn đọc tìm hiểu về hai loại công cụ bổ trợ trong PowerBI là Refreshing Queries và Defining Data Queries nhằm phục vụ cho bảng dữ liệu của chúng ta được xử lý Data dễ dàng hơn. Bên cạnh đó, ở cuối bài học này, Gitiho.com cũng sẽ chia sẻ một số kiến thức về quá trình làm sạch Data khi chúng ta làm việc với PowerBI.
PBIG01 - Thành thạo Microsoft PowerBI để Trực quan hóa và Phân tích dữ liệu
Đọc thêm: Hướng dẫn cách cài đặt tài khoản PowerBI Pro miễn phí 2021
Defining Data Categories có thể hiểu nghĩa tiếng Việt là "Xác định danh mục Data". Công cụ xử lý Data trên PowerBI này xuất hiện khi bạn ở chế độ Data View thì từ tab "Modelling" chúng ta có thể chỉnh sửa thuộc tính theo các danh mục (Categories) đặc biệt. Những Categories đặc biệt để xác định các trường liên quan đến địa lý như addresses, cities, zip code,... Để có thể kết nối với bản đồ (Map)
Đọc thêm: Hướng dẫn cách sử dụng hiệu quả Grouping Data trong PowerBI
Ngay khi mở PowerBI lên, ta di chuột đến công cụ Refresh thì nó sẽ tự động thông báo với người dùng rằng tất cả các dữ liệu đã được cập nhật mới nhất
Ngoài ra, như đã nói ở trên, để cài tùy chỉnh Refresh cho bảng dữ liệu thì chúng ta hãy nhấn chuột phải vào bảng dữ liệu đó rồi nhấn vào "Include in report refresh"
Khi đã tích vào tùy chọn này thì Data của người dùng sẽ được tự động Refresh khi mở lên hoặc khi sử dụng. Còn không thì dữ liệu trong bảng sẽ giữ nguyên
Đọc thêm: Các chức năng và công cụ xử lý dữ liệu dạng Date của PowerBI
Để sử dụng được Defining Data Categories, chúng ta sẽ truy cập vào Data View để nhận dạng một số loại Categories đặc biệt bằng cách nhấn vào các cột rồi chọn Column Tools
Từ đó chúng ta có thể Format các cột này theo những dạng Data đặc biệt tại các tab mở rộng để dễ dàng hơn trong việc xử lý Data
Từ bước này chúng ta có thể chủ động có bước xử lý Data trước khi nhập chúng vào PowerBI bằng Power Query Editor
Bước đầu cũng là bước quan trọng nhất khi người dùng sử dụng PowerBI là xử lý Data trong Queries Editor trước rồi mới load data vào PowerBI. Thay vì chúng ta Load Data trước rồi cập nhật, chỉnh sửa sau thì ta cần phải làm đúng quy trình là làm sạch Data trước khi bắt đầu, bởi việc Data Load vào sau rồi mới chỉnh sử sẽ rất tốn thời gian để xử lý Data
Ngoài ra nếu có thể thì chúng ta nên tổ chức các file/folder theo cấu trúc để tránh phải chỉnh sửa nguồn Data nhiều lần
Không phải bảng dữ liệu nào cũng yêu cầu người dùng phải cập nhật thường xuyên, do vậy bảng kết quả của chúng ta là quá trình Lookup hoặc bảng tĩnh (Không thay đổi giá trị) thì chúng ta không cần đến Report Refresh. Quá trình Refresh này sẽ tiêu tốn nhiều thời gian cũng như bộ nhớ của máy tính và không làm sạch cho Data của chúng ta. Bởi vậy mà bảng tính nào mà chúng ta cũng Refresh thì file của chúng ta sẽ rất nặng và hoạt động không được trơn tru, hay tệ hơn là PowerBI sẽ không phản hồi lại người dùng
Khi làm việc với bảng dữ liệu lớn, chúng ta chỉ cần Load Data mà chúng ta thực sự cần, bởi khi bảng dữ liệu chiết xuất quá nhiều Data thì có thể khiến Bảng, Model và file PowerBI bị chậm trong xử lý hay xảy ra sự cố không mong muốn trong quá trình làm việc
Đọc thêm:
HƯỚNG DẪN CÁCH SỬ DỤNG HÀM MROUND TRONG POWER BI DAX
Tải miễn phí Ebook: Kể chuyện qua dữ liệu
Cách sử dụng trang tính Google làm nguồn dữ liệu cho Power BI
11 Công cụ trực quan hóa dữ liệu tốt nhất hiện nay (Cập nhật 2021)
Tài liệu kèm theo bài viết
Cùng tham gia cộng đồng hỏi đáp về chủ đề Power BI
0 Bình luận