Gitiho Learning 3
Gitiho Learning 3
Thảo luận 0 thảo luận
Vỗ tay 0 vỗ tay
Lượt xem 133 lượt xem

Các công cụ bổ trợ và những lưu ý khi xử lý Data trong PowerBI

Gitiho Learning 3
Gitiho Learning 3
Apr 16 2021

Bài viết này Gitiho.com sẽ cùng bạn đọc tìm hiểu về hai loại công cụ bổ trợ trong PowerBI là Refreshing Queries và Defining Data Queries nhằm phục vụ cho bảng dữ liệu của chúng ta được xử lý Data dễ dàng hơn. Bên cạnh đó, ở cuối bài học này, Gitiho.com cũng sẽ chia sẻ một số kiến thức về quá trình làm sạch Data khi chúng ta làm việc với PowerBI.

PBIG01 - Thành thạo Microsoft PowerBI để Trực quan hóa và Phân tích dữ liệu

Xử lý Data bằng công cụ Refreshing Queries

Khi nói về làm cập nhật dữ liệu trong PowerBI thì công cụ xử lý Data đầu tiên mà những người làm BI sẽ nhắc tên là Refresh. Khi người dùng nhấn vào công cụ Refresh thì các Queries trong Data Model sẽ được cập nhật. Tuy nhiên việc cài đặt Refresh này không phải lúc nào cũng cần thiết, do vậy để cài đặt bảng Data có cần phải Refresh thường xuyên hay không thì chúng ta có thể cài đặt thông qua chức năng "Include in report Refresh" cho từng Queries riêng biệt 

Đọc thêm: Hướng dẫn cách cài đặt tài khoản PowerBI Pro miễn phí 2021


Xử lý Data bằng công cụ Defining Data Categories

Defining Data Categories có thể hiểu nghĩa tiếng Việt là "Xác định danh mục Data". Công cụ xử lý Data trên PowerBI này xuất hiện khi bạn ở chế độ Data View thì từ tab "Modelling" chúng ta có thể chỉnh sửa thuộc tính theo các danh mục (Categories) đặc biệt. Những Categories đặc biệt để xác định các trường liên quan đến địa lý như addresses, cities, zip code,... Để có thể kết nối với bản đồ (Map) 

Đọc thêm: Hướng dẫn cách sử dụng hiệu quả Grouping Data trong PowerBI


Thực hành xử lý Data bằng công cụ Refreshing Queries trên PowerBI 

Ngay khi mở PowerBI lên, ta di chuột đến công cụ Refresh thì nó sẽ tự động thông báo với người dùng rằng tất cả các dữ liệu đã được cập nhật mới nhất

Ngoài ra, như đã nói ở trên, để cài tùy chỉnh Refresh cho bảng dữ liệu thì chúng ta hãy nhấn chuột phải vào bảng dữ liệu đó rồi nhấn vào "Include in report refresh"

Khi đã tích vào tùy chọn này thì Data của người dùng sẽ được tự động Refresh khi mở lên hoặc khi sử dụng. Còn không thì dữ liệu trong bảng sẽ giữ nguyên

Đọc thêm: Các chức năng và công cụ xử lý dữ liệu dạng Date của PowerBI

Thực hành xử lý Data với công cụ Defining Data Categories

Để sử dụng được Defining Data Categories, chúng ta sẽ truy cập vào Data View để nhận dạng một số loại Categories đặc biệt bằng cách nhấn vào các cột rồi chọn Column Tools


Từ đó chúng ta có thể Format các cột này theo những dạng Data đặc biệt tại các tab mở rộng để dễ dàng hơn trong việc xử lý Data

Từ bước này chúng ta có thể chủ động có bước xử lý Data trước khi nhập chúng vào PowerBI bằng Power Query Editor

Một số lưu ý khi xử lý Data trong PowerBI

Xử lý Data trước khi Load vào PowerBI

Bước đầu cũng là bước quan trọng nhất khi người dùng sử dụng PowerBI là xử lý Data trong Queries Editor trước rồi mới load data vào PowerBI. Thay vì chúng ta Load Data trước rồi cập nhật, chỉnh sửa sau thì ta cần phải làm đúng quy trình là làm sạch Data trước khi bắt đầu, bởi việc Data Load vào sau rồi mới chỉnh sử sẽ rất tốn thời gian để xử lý Data

Ngoài ra nếu có thể thì chúng ta nên tổ chức các file/folder theo cấu trúc để tránh phải chỉnh sửa nguồn Data nhiều lần

Tắt Report Refresh với các nguồn bảng tĩnh để làm sạch Data

Không phải bảng dữ liệu nào cũng yêu cầu người dùng phải cập nhật thường xuyên, do vậy bảng kết quả của chúng ta là quá trình Lookup hoặc bảng tĩnh (Không thay đổi giá trị) thì chúng ta không cần đến Report Refresh. Quá trình Refresh này sẽ tiêu tốn nhiều thời gian cũng như bộ nhớ của máy tính và không làm sạch cho Data của chúng ta. Bởi vậy mà bảng tính nào mà chúng ta cũng Refresh thì file của chúng ta sẽ rất nặng và hoạt động không được trơn tru, hay tệ hơn là PowerBI sẽ không phản hồi lại người dùng

Chỉ Load Data thật sự cần thiết vào bảng dữ liệu xử lý Data dễ dàng hơn

Khi làm việc với bảng dữ liệu lớn, chúng ta chỉ cần Load Data mà chúng ta thực sự cần, bởi khi bảng dữ liệu chiết xuất quá nhiều Data thì có thể khiến Bảng, Model và file PowerBI bị chậm trong xử lý hay xảy ra sự cố không mong muốn trong quá trình làm việc


Đọc thêm:

HƯỚNG DẪN CÁCH SỬ DỤNG HÀM MROUND TRONG POWER BI DAX

Tải miễn phí Ebook: Kể chuyện qua dữ liệu

DÂN VĂN PHÒNG LÀM POWER BI, GOOGLE DATA STUDIO CÓ THỂ LẤY DỮ LIỆU TỪ MỌI NGUỒN DATABASE (CSDL) MÀ KHÔNG CẦN IT

Cách sử dụng trang tính Google làm nguồn dữ liệu cho Power BI

11 Công cụ trực quan hóa dữ liệu tốt nhất hiện nay (Cập nhật 2021)



Tài liệu kèm theo bài viết

Gitiho.com Nền tảng học online dành cho người đi làm duy nhất tại Việt Nam cam kết hỗ trợ học viên 24/7

Với sứ mệnh: “Mang cơ hội phát triển kỹ năng, phát triển nghề nghiệp tới hàng triệu người”, đội ngũ phát triển Gitiho.com đã và đang làm việc với những học viện, trung tâm đào tạo, các chuyên gia đầu ngành để nghiên cứu và xây dựng lên các chương trình đào tạo từ cơ bản đến chuyên sâu xung quanh các lĩnh vực: Tin học văn phòng, Phân tích dữ liệu, Thiết kế, Công nghệ thông tin, Kinh doanh, Marketing, Quản lý dự án...
Gitiho tự hào khi được đồng hành cùng:
  • 50+ khách hàng doanh nghiệp lớn trong nhiều lĩnh vực như: Vietinbank, Vietcombank, BIDV, VP Bank, TH True Milk, VNPT, FPT Software, Samsung SDIV, Ajinomoto Việt Nam, Messer,…
  • 100.000+ học viên trên khắp Việt Nam

Nếu bạn quan tâm đến các kiến thức về phân tích dữ liệu, hãy truy cập ngay TẠI ĐÂY và tìm cho mình khóa học phù hợp nhé!



Thảo luận 0 câu trả lời
Lượt xem 133 lượt xem
Vỗ tay vỗ tay

0 Bình luận

@ 2020 - Bản quyền của Công ty TNHH Công Nghệ Giáo Dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội