Kiến thức
5 phút đọc

Data Lineage Là Gì? Tại Sao Nên Sử Dụng Dòng Dữ Liệu

Data Lineage là gì? Dòng dữ liệu trong Power BI service là gì? Cách để sử dụng dòng dữ liệu trong Power BI service? Nếu như các bạn đang quan tâm những câu hỏi này thì bài viết này là dành cho các bạn. Trong bài viết này, MDA sẽ giải thích chi tiết về dòng dữ liệu và cách sử dụng nó.

1. Data Lineage là gì?

Trong các dự án, hiểu được luồng dữ liệu của toàn bộ dự án có thể là thách thức. Các câu hỏi như “Điều gì xảy ra nếu tôi thay đổi dữ liệu này?” hoặc “Tại sao báo cáo này không được cập nhật?” đôi khi sẽ rất khó để trả lời. Để giúp giải thích những câu hỏi này, Data lineage view của Power BI giúp bạn trả lời những câu hỏi này.

Data Lineage là gì?

Nhiều bộ dữ liệu và DataFlow kết nối với các nguồn dữ liệu bên ngoài như SQL Server hoặc với các bộ dữ liệu bên ngoài trong các không gian làm việc khác. Trong Data Lineage, bạn sẽ thấy được các mối quan hệ trong không gian làm việc và tất cả các mối quan hệ bên ngoài của nó. Nó hiển thị các kết nối giữa tất cả không gian làm việc. Điều này bao gồm các kết nối với DataFlows và cả đích đến của nó

2. Xem luồng dữ liệu trong Power BI service.

Mỗi không gian làm việc sẽ có chế độ xem data lineage. Để xem được nó bạn phải có vai trò ít nhất là đóng góp trong không gian làm việc đó.

Để truy cập vào lineage, hãy vào chế độ xem danh sách không gian làm việc. Nhấn vào mũi tên bên cạnh để xem List view và Lineage view.

Tất cả các tạo tác không gian làm việc và cách dữ liệu chảy từ chỗ này sang chỗ khác.

2.1. Nguồn dữ liệu

Bạn sẽ thấy các nguồn dữ liệu mà dữ liệu và dataflow đã lấy từ đâu. Trên thẻ nguồn dữ liệu, bạn thấy thêm thông tin có thể giúp xác định nguồn. Ví dụ: đối với Azure SQL Server, bạn cũng thấy tên cơ sở dữ liệu.

Nguồn dữ liệu trong Data Lineage

2.2. Gateways

Nếu một nguồn dữ liệu được kết nối thông qua gateway, thông tin cổng được thêm vào thẻ nguồn dữ liệu. Nếu bạn có quyền là quản trị viên cổng hoặc là người dùng nguồn dữ liệu, bạn sẽ thấy thêm thông tin, chẳng hạn như tên cổng.

Gateaways trong data lineage

2.3. Bộ dữ liệu và DataFlows

Trên bộ dữ liệu và DataFlow, bạn thấy thời gian gần nhất mà dữ liệu được làm mới. Bạn cũng sẽ thấy được bộ dữ liệu hoặc DataFlow được chứng nhận hoặc publish hay chưa.

Bộ dữ liệu và Dataflows trong Data Lineage

Nếu một báo cáo được xây dựng dựa trên tập dữ liệu hoặc dataflowtrong không gian làm việc khác, bạn sẽ thấy tên không gian làm việc nguồn trên thẻ của bộ dữ liệu hoặc dataflow đó. Chọn tên của không gian làm việc nguồn để đi đến không  gian làm việc đó để xem.

Xem thêm: Tổng Quan Về Luồng Dữ Liệu (Dataflow)

2.4. Hiển thị lineage cho bất kỳ aritfact nào

Hiển thị Data Lineage cho bất kỳ aritfact

Chọn các mũi tên kép dưới các mục, Power BI làm nổi bật tất cả mục liên quan đến mục mà bạn chọn và làm mờ các phần còn lại.

2.5. Điều hướng và Chế độ xem toàn màn hình

Bạn có thể sử dụng chuột và bàn di chuột để điều hướng trong khung vẽ, cũng như để phóng to hoặc phóng to. Để phóng to và thu nhỏ, sử dụng menu ở góc dưới bên phải hoặc chuột hoặc bàn di chuột của bạn. Để có nhiều chỗ hơn cho chính biểu đồ, hãy sử dụng tùy chọn toàn màn hình ở góc dưới bên phải.

Điều hướng và chế độ xem toàn màn hình cho Data Lineage

Trên đây là một số giới thiệu về data lineage là gì trong Power BI service. Hy vọng qua bài viết này, các bạn có thể hiểu rõ hơn về dòng dữ liệu cũng như các thao tác với nó.

Xem thông tin khai giảng Khóa học Business Intelligence mới nhất tại Mastering Data Analytics. Liên hệ 0961 48 48 66 hoặc inbox Fanpage Mastering Data Analytics để đăng ký nhanh nhất nhé!