Nâng trình phân tích dữ liệu kinh doanh bằng những khóa học của MDA
Tổng Quan Về Luồng Dữ Liệu Trong Power BI
Mục Lục
Trong bài viết này, hãy cùng Mastering Data Analytics tìm hiểu về Luồng dữ liệu trong Power BI. Chú ý rằng khi nào thì chúng ta nên sử dụng Luồng dữ liệu, cũng như những lợi ích và hạn chế của nó.
1 . Luồng dữ liệu là gì?
Khi khối lượng dữ liệu tăng lên, thì thách thức trong việc sắp xếp dữ liệu đó thành thông tin hữu ích được định dạng tốt cũng vậy. Nếu bạn muốn dữ liệu sẵn sàng để phân tích, để đưa vào hình ảnh trực quan, báo cáo và Dashboard, để bạn có thể nhanh chóng biến dữ liệu của mình thành những insight hữu ích. Với tính năng chuẩn bị dữ liệu tự phục vụ cho dữ liệu lớn trong Power BI, cho phép bạn chuyển từ dữ liệu sang Power BI insight chỉ bằng vài cú nhấp chuột.
Luồng dữ liệu Power BI (Dataflow) cho phép bạn xây dựng các bảng dữ liệu có thể tái sử dụng trong không gian làm việc bằng Power Query Online và chia sẻ chúng để sử dụng trong các báo cáo khác cũng như với những người dùng khác để sử dụng lại trong các không gian làm việc khác. Luồng dữ liệu là các đối tượng trong không gian làm việc cùng với bộ dữ liệu, bảng điều khiển, báo cáo và sổ làm việc.
2. Khi nào nên sử dụng luồng dữ liệu?
Luồng dữ liệu là một lựa chọn tuyệt vời cho bạn nếu:
- Tổ chức của bạn không có kho dữ liệu.
- Bạn muốn mở rộng tập dữ liệu cốt lõi hoặc dữ liệu trong kho với dữ liệu nhất quán.
- Người dùng tự phục vụ (self serivce user) cần có quyền truy cập thường xuyên vào tập hợp con dữ liệu được cập nhật từ kho dữ liệu mà không cần có quyền truy cập vào chính kho dữ liệu đó.
- Bạn có nguồn dữ liệu tính phí.
Có thể giảm chi phí liên quan đến việc làm mới dữ liệu
Tăng khả năng kiểm soát và giảm số lần truy cập đến hệ thống nguồn.
Bộ dữ liệu làm mới theo luồng dữ liệu mà không ảnh hưởng đến hệ thống nguồn.
- Bạn có các bộ dữ liệu với các phiên bản khác nhau trôi nổi trong tổ chức của mình. Luồng dữ liệu tăng tính nhất quán giữa các bộ dữ liệu.
Tăng tính nhất quán về cấu trúc.
Nâng cao tính nhất quán theo thời gian bằng cách có một bộ dữ liệu được trích xuất từ hệ thống nguồn tại một thời điểm duy nhất.
Các bảng được chia sẻ không có nguồn có thể được chuẩn hóa trong tổ chức của bạn.
- Bạn muốn giảm hoặc ẩn độ phức tạp của nguồn dữ liệu.
Bạn có thể hiển thị các thực thể dữ liệu chung đã được chuyển đổi và đơn giản hóa cho các nhóm nhà phân tích lớn hơn.
Bạn cũng có thể phân vùng dữ liệu theo chiều ngang (partition data horizontally), sử dụng nhiều luồng dữ liệu.
3. Lợi ích và hạn chế
Những lợi ích:
- Giảm tải cho các truy vấn cơ sở dữ liệu.
- Hạn chế số lượng người dùng truy cập dữ liệu nguồn.
- Cung cấp phiên bản dữ liệu có cấu trúc duy nhất phù hợp để xây dựng báo cáo từ đó.
Hạn chế:
- Không phải là một sự thay thế cho một kho dữ liệu.
- Bảo mật cấp dòng (Row level security) không được hỗ trợ.
- Nếu không sử dụng dataflow ở Premium capacity, hiệu suất có thể là một vấn đề.
Như vậy, Dataflow là một công cụ hữu ích có thể giúp người dùng tiết kiệm công sức, tăng tính nhất quán cho dữ liệu, giảm số lượng truy vấn hoặc chi phí truy vấn đến dữ liệu nguồn.
Xem thông tin khai giảng Khóa học Business Intelligence mới nhất tại Mastering Data Analytics. Liên hệ Hotline: 0961 48 48 66 hoặc inbox Fanpage Mastering Data Analytics để đăng ký nhanh nhất nhé!