Nguyễn Minh Đức
Nguyễn Minh Đức
Thảo luận 12 thảo luận
Vỗ tay 0 vỗ tay
Lượt xem 305 lượt xem

Em có data của 2020 và 2021 với 12 file cho từng tháng Vậy khi e muốn dùng làm

Chào Thầy,

Em có data của 2020 và 2021 với 12 file cho từng tháng. Vậy khi e muốn dùng làm pơwer pivot thì làm 2 query riêng cho 2020 và 2021 sau đó relationship hay gôm chung thành 1 query cho total cả 2  năm. Thì cái nào tối ưu hơn ạ

Thảo luận 12 câu trả lời
Lượt xem 305 lượt xem
Vỗ tay vỗ tay
Nguyễn Minh Đức 16:05 - May 27, 2021

Mình nên tạo ra 2 query riêng, bằng tính năng Get Data từ Folder, 2 query đó bạn cứ để thành 2 bảng. 

Trong trường hợp cần so sánh dữ liệu (như so sánh với cùng kỳ năm trước) thì bạn nên tạo 1 query total cho cả 2 năm, còn trường hợp chỉ làm báo cáo số liệu 2021, thì ko cần. Không nên tạo Relationship giữa 2 bảng data, ở đây là sale 2020 và 2021, mà ta chỉ nên tạo relationship từ 1 bảng data đến 1 bảng thông tin, ví dụ bảng Sale có relationship tới bảng Product/Customer ...

Vỗ tay vỗ tay
Nguyễn Minh Đức 17:05 - May 27, 2021

Chào Thầy,

Nếu trong file đầu tiên làm mẫu em chỉ lấy những trường cần thiết & xóa đi trong raw Sales, sau đó Combine & Tranform thì những file sau có tự động xóa hết các trường đó không ạ?

Hay mình bắt buộc phải để y như vậy sau khi tranform xong mới xóa ạ

Vỗ tay vỗ tay
Nguyễn Minh Đức 13:05 - May 28, 2021

À không, nếu bạn mà xóa bằng tay trong Excel thì làm sao mà tự động xóa hết các trường còn lại được. 

Quy trình làm như thế này: 

- Ví dụ, mình tạo 1 folder để dữ liệu của các tháng trong năm ntn: 

Mình sẽ tạo 1 query để lấy dữ liệu bằng Power Query, sử dụng Combine and Transform để gộp các file tháng 

Ở bước sample cứ lấy 1 file mẫu 

Ta có một file Sale Data là dữ liệu đã được gộp, bây giờ bạn bỏ đi các trường ko cần sử dụng bằng Remove Other Column

Thì kết quả Query sẽ chỉ giữ lại các cột đó, ở đây ko xóa, vì ta chỉ cần bỏ step đấy đi là các trường cũ quay lại (điểm mạnh của Power Query so với xóa tay)

Bạn Lưu Query lại, lưu ra bảng hoặc vào Data Model như hướng dẫn ở trên.

Khi có dữ liệu tháng mới, bạn chỉ cần Refresh, thì file mới sẽ được nối thêm vào bảng và cũng thực hiện các thao tác tương tự

Vỗ tay vỗ tay
Nguyễn Minh Đức 00:05 - May 29, 2021

Em chào Thầy, 

Cho em hỏi file sample Maven Market như trên là ở đâu có vậy Thầy

Vỗ tay vỗ tay
Nguyễn Minh Đức 16:05 - May 29, 2021

Chào Thầy,

Em đang tổng hợp file thì excel hiện ra như thế này? Cái này có bị lỗi gì không Thầy


Vỗ tay vỗ tay
Nguyễn Minh Đức 20:05 - May 29, 2021

Lỗi hiện ra như thế này là sao vậy Thầy? Mình khắc phục lỗi này như thế nào ạ?


Vỗ tay vỗ tay
Nguyễn Minh Đức 20:05 - May 29, 2021

Data em 12 tháng mà em chỉ mới load tới 08 là ngày 10/08/2020 ko load được nữa? Có cách nào khắc phục không ạ?

Vỗ tay vỗ tay
Nguyễn Minh Đức 00:05 - May 31, 2021

Data của bạn đang nhiều hơn 1.048.576 dòng này bạn, data của bạn đang lớn hơn khả năng lưu trữ trên 1 sheet của Excel, nên chỉ load đc đến hơn 1 triệu dòng là bị dừng mất rồi. 

Với dữ liệu lớn như thế này thì Excel ko xử lý được, bạn tham khảo phần mềm Power BI nhé. Bạn đã học Power Query rồi thì trong Power BI dễ sử dụng lắm, vì Power BI cũng của Microsoft và lấy dữ liệu, chỉnh sửa dữ liệu bằng Power Query luôn

Vỗ tay vỗ tay
Nguyễn Minh Đức 00:05 - May 31, 2021

Nếu dùng PI thì mình có tính hay so sánh như Power Pivot được không ạ

Vỗ tay vỗ tay
Nguyễn Minh Đức 00:05 - May 31, 2021
Power BI có thể xử lý được bao nhiêu dòng ạ? Do data mình rất lớn ít nhất cũng phải hơn 2 triệu dòng cho 12 tháng :(
Vỗ tay vỗ tay
Nguyễn Minh Đức 10:05 - May 31, 2021

Chào bạn Power BI thì sẽ thừa sức làm được cái này nhé.

Vỗ tay vỗ tay
Nguyễn Minh Đức 12:05 - May 31, 2021

Power BI có thể so sánh và mạnh mẽ hơn Power Pivot rất nhiều, về dữ liệu thì là không giới hạn, còn số dòng để xử lý tốt thì khoảng ~12 triệu dòng (lớn hơn thì có thể sẽ load chậm hoặc cần máy cấu hình cao)

Vỗ tay vỗ tay
Câu hỏi liên quan
@ 2020 - Bản quyền của Công ty cổ phần công nghệ giáo dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội