1. Xác định các ngoại lệ (Outliers) và sự bất thường (Anomalies)
Điều này liên quan đến việc tìm kiếm các xu hướng và điểm dữ liệu khác với thông thường.
1.1. Ví dụ:
– Những thay đổi đột ngột về xu hướng.
– Các thuộc tính (Attributes) hoạt động quá mức hoặc kém hiệu quả so với trước đây.
– Số liệu lệch xa so với mục tiêu đặt ra.
Trên thực tế, có thể liên quan đến việc xác định các thành phố, quận, sản phẩm và nhân viên bán hàng hoạt động quá mức hoặc hoạt động kém ở mức đáng kể so với doanh nghiệp của bạn.
1.2. Các loại trực quan hóa có thể sử dụng để thực hiện điều này là:
– Biểu đồ thanh xếp chồng (Stacked bar charts)
– Biểu đồ ma trận (Chart matrices)
– Biểu đồ đường tích lũy (Cumulative line charts)
– Biểu đồ hộp (Box-and-whisker plots)
– Biểu đồ tần suất (Histograms)
– Biểu đồ phân tán (Scatter plots)
– Biểu độ nhiệt (Heat tables)
1.3. Các phương pháp phân tích:
– Sử dụng điểm Z để phát hiện các ngoại lệ
– Xác định các giá trị ở các phần tư trên và dưới của Phạm vi liên tứ phân vị
2. Xác định nguyên nhân và mối quan hệ
Điều này liên quan đến việc tìm kiếm các yếu tố thúc đẩy xu hướng tăng và giảm trong dữ liệu của bạn.
Trên thực tế, có thể liên quan đến việc tìm kiếm mức tăng mạnh về doanh số bán hàng ở một quốc gia và xác định các thành phố và quận cụ thể đóng góp vào doanh số bán hàng đó.
Các loại trực quan bao gồm:
– Biểu đồ ma trận (Chart matrices) để bạn có thể quan sát xu hướng của nhiều chiều cùng một lúc.
– Biểu đồ phân tán Scatter plots) lý tưởng để xác định mối tương quan hoặc sự thiếu tương quan.
– Các biểu đồ tương quan (Correlation plots) có thể được sử dụng để phân tích mối tương quan của nhiều chiều tại một thời điểm.
Lưu ý: Power BI có tính năng thông tin chi tiết sẽ giúp bạn tự động xác định nguyên nhân.
3. Phân khúc (segment) và nhóm (group) dữ liệu theo thông tin khách hàng
Điều này liên quan đến việc chuyển đổi dữ liệu và tạo các cột mới trong tập dữ liệu. Khi bạn thay đổi cách trình bày dữ liệu của mình, bạn sẽ có khả năng tìm thấy những insight sâu sắc chưa từng thấy trước đây.
1.1. Ví dụ:
– Chuyển đổi các giá trị số thành các nhóm phân loại (bins)
– Chuyển đổi giá trị phân loại thành giá trị số
– Chuyển đổi trường thứ nguyên có số lượng thuộc tính cao thành trường thứ nguyên có ít nhóm thuộc tính đó hơn
– Sử dụng các phương pháp phân cụm như k-means hoặc PCA để nhóm các mục có thuộc tính tương tự lại với nhau
Trên thực tế, có thể liên quan đến việc phân loại sản phẩm trong công ty của bạn thành các danh mục dựa trên các giai đoạn hoặc thuộc tính trong vòng đời sản phẩm của chúng. Hoặc bạn có thể muốn đặt các giá trị số vào các ô để dễ dàng phát hiện sự khác biệt trong một phạm vi số cao.
1.2: Công cụ thực hiện
Công cụ phổ biến mà bạn có thể sử dụng để thực hiện chuyển đổi dữ liệu: Power BI’s Power Query Editor