Kiến thức
10 phút đọc

[7] Top 2 Lý Do Chính Để Dùng Công Nghệ BI Platforms Tìm “Deeper BI Insights”

Hiện nay, có rất nhiều tranh luận xoay quanh việc dùng công nghệ BI để phân tích dữ liệu. Bản thân mình cũng chia sẻ rất rõ quan điểm của mình về vấn đề này. Chính là “Hãy lựa chọn những công nghệ phù hợp với nhu cầu phân tích của bạn”.

Các tiêu chí chọn công nghệ phân tích dữ liệu dành cho doanh nghiệp

Phân biệt về các nhóm công nghệ phân tích dữ liệu bạn có thể theo dõi bài viết trước. Trong bài viết đã có giải thích chi tiết và nhiều dẫn chứng. Sau khi đã phân biệt được các nhóm công nghệ, các doanh nghiệp có thể lựa chọn công nghệ phù hợp dựa trên một số tiêu chí chính.

1. Tiêu chí chọn công nghệ phân tích dữ liệu

Độ lớn của dữ liệu hiện tại của doanh nghiệp

Doanh nghiệp nhỏ, dữ liệu ít hoàn toàn có thể dùng Power Query + Power Pivot trong Excel để làm. Phương pháp này thường gọi là Modern Excel, chứ không phải cách thủ công như làm Excel truyền thống.

Doanh nghiệp lớn hơn có thể sử dụng Visual-based Analytics Platforms (Power BI, Tableau, Qlik, Alteryx, Dataiku …) hay Coding-based Analytics Platforms (SQL, R, Python…) tùy vào nhu cầu và khả năng của mình. Mình chỉ mong mọi người có cái nhìn khách quan hơn về những công nghệ Visual-based Platforms như Power BI, đừng nghĩ chỉ dùng để trực quan hóa dữ liệu/ không làm được dữ liệu lớn/ không linh động measures…. thôi là được ạ, mọi người có thể đọc lại bài viết [6] để hiểu rõ hơn.

Độ phức tạp về nhu cầu phân tích

Ví dụ nếu muốn làm Advanced Analytics thì phải dùng công nghệ advance như Python/ Alteryx/ Data bricks … hay những công nghệ dẫn đầu trong mảng này như gợi ý của Gartner DS&ML Platforms hàng năm có update.

Ngân sách công ty 

Ví dụ chi phí bản quyền từng license Power BI rẻ hơn Tableau, Qlik…

Khả năng công nghệ của nhân sự 

Lý do các công nghệ Low-code; Self-service được là dễ sử dụng, thân thiện với người dùng.

Ưu tiên về bảo mật an toàn dữ liệu

Tốc độ phân tích dữ liệu

2. Source tham khảo

Source dùng để so sánh chức năng/ giá cả/ review người dùng của các công nghệ:

(i) Capterra: mọi người lựa chọn theo mảng mình muốn so sánh vd BI, Statistic, Predictive … (miễn phí)

(ii) SelectHub: hình 2 bên dưới, xem cơ bản miễn phí, muốn xem chi tiết hơn thì hình như có tính phí

Hiện nay các doanh nghiệp đang sử dụng đa dạng các data analytics platforms. Các data analytics platforms thông thường sẽ thuộc danh sách. Với nội dung này đã được giải thích ở bài viết trước.

Theo dự báo của Gartner vào 2024, 75% các doanh nghiệp lớn trên thế giới sẽ sử dụng ít nhất 4 Low-code Platforms để phân tích dữ liệu trong doanh nghiệp.

 Lý do doanh nghiệp chọn Low-code platforms

Nhưng! Nếu doanh nghiệp muốn triển khai các hệ thống/ phân tích dữ liệu Business Intelligence để khai thác “deeper BI Insights” thì bắt buộc phải dùng các Business Intelligence Platforms. Lý do chính không phải nằm ở: thân thiện người dùng, dễ sử dụng, low-code nên làm nhanh chứ từ cái đơn giản code lâu, phổ biến trên thế giới, cập nhật tính năng mới liên tục mỗi tháng, tích hợp nhiều tính năng trí tuệ nhân tạo làm phân tích nhanh và hiệu quả hơn, miễn phí bảng Desktop để làm quen.

Lý do chính nằm ở: khả năng Dynamic + Interactivity & End-to-end

Tại sao mình nghĩ điều này quan trọng?

Trước khi trả lời, mình sẽ giải thích 2 cách phân tích dữ liệu phổ biến hiện nay.

  • Isolated Analytics method: phân tích dữ liệu 1 cách rời rạc
  • End-to-End Analytics method: phân tích dữ liệu 1 cách liên tục

Phân biệt: Isolated Analytics method vs End-to-End Analytics method

1. Isolated Analytics Method

Ví dụ dưới đây mình sẽ mô tả lại “flow” phân tích bị rời rạc (isolated) như sau:

Bước 1: Bạn dùng SQL để code lấy dữ liệu ra.

Truy vấn dữ liệu từ bảng


Bước 2: Bạn sẽ có file dữ liệu thô được được xử lý.


Bạn có thể xuất dữ liệu thành nhiều cách ra file dữ liệu thô trên Excel
Bước 3: Bạn dùng Pivot chart/ pivot table (Excel) vẽ lên chart để phân tích.
Hình mô tả vẽ chart trên dataset excel
Bước 4: Sau đó mọi người dán chart vào Powerpoint để trình bày, và nó được fix cứng.

Ví dụ: Khi bạn muốn kiểm tra số doanh thu tháng 5 rơi vào thứ 3 sao cao nhất? Thì bạn phải code/ truy vấn lại dữ liệu gốc thủ công, còn với công nghệ BI bạn chỉ cần bấm “show data”. Điều này cực kỳ quan trọng và cần thiết đối với người phân tích để hiểu bản chất dữ liệu và thông tin.

2. End-to-End Analytics Platforms

Dòng chảy dữ liệu được liên tục, nhất quán, giảm sai sót khi phân tích. Đặc biệt mỗi do thao tác tay, thủ công – human error.


Power BI End-to-End

Slide giải thích chi tiết cho End-to-End Platforms with Power BI, mọi người xem tại file PDF trên nhé!

Khi bạn làm được End-to-End Analytics Platforms, khi đang phân tích, bạn muốn kiểm tra số liệu, bạn có thể ngay lập tức truy vấn ngược dữ liệu để kiểm tra ngay bằng cách bấm show data. Kiểm tra được dữ liệu gốc ngay lập tức, hoặc quay trở lại màn hình Data model/ Power query để lọc xem lại dữ liệu.

End-to-end Analytics: chìa khóa tìm “Deeper BI Insights”


 Show data

 Show data

Tương tác trực tiếp trên Power Point & Power BI

https://youtu.be/P7_pvTUTkKk

Interactivity

Interactivity là tương tác dữ liệu ngay lập tức để nhìn thông tin liên kết với nhau. Đây là chìa khóa tìm “deeper BI Insights”

Và điều quan trọng nhất là khả năng dynamic + interactivity giúp người phân tích nhìn ra bức tranh tổng thể ngay lập tức. Chứ không phải rời rạc như Coding-based Analytics Platform.


Tính năng Interactivity
Trực quan hóa dữ liệu Python có thể làm được nhiều loại chart phức tạp, hoặc xử lý được dữ liệu lớn, tuy nhiên bị rời rạc isolated (silo analysis)

Sau này mình có cơ hội tìm hiểu một số giải pháp Dynamic & Interactivity Dashboard in Python. Nhưng nó khá hạn chế so với các công nghệ BI, tham khảo link bên dưới.

Build a Fully Interactive Dashboard in a Few Lines of Python

Bạn có thể xử lý dữ liệu dữ liệu bên dưới bằng SQL/R/Python rồi đẩy dữ liệu qua Power BI để Data Visualization nhưng sẽ làm mất khả năng end-to-end của dòng chảy dữ liệu. Vì thế cần cân nhắc cách xử lý tùy theo nhu cầu phân tích của mình. Đó là lý do vì sao Power BI tích hợp các ngôn ngữ lập trình vào để xử lý để đảm bảo: tăng khả năng xử lý phức tạp nhưng hạn chế dòng chảy dữ liệu bị ngắt quãng.

Xử lý dữ liệu lớn đầu vào bằng cách tích hợp ngôn ngữ lập trình

Xem thêm: Build a Fully Interactive Dashboard in a Few Lines of Python

Khóa học Business Intelligence tại Mastering Data Analytics

Tham khảo thông tin KHÓA HỌC “PHÂN TÍCH DỮ LIỆU KINH DOANH” – ONLINE/OFFLINE.
Mastering Data Analytics là đơn vị dẫn đầu mảng Đào tạo kĩ năng Phân tích dữ liệu kinh doanh tại Việt Nam. Các khóa học Phân tích dữ liệu kinh doanh tại trung tâm sẽ được khai giảng định kỳ hàng tháng. Mỗi lớp học thu hút +100 anh/chị học viên. MDA tự hào là trung tâm đào tạo Phân tích dữ liệu kinh doanh duy nhất tại Việt Nam thu hút được đông đảo học viên mỗi lớp như vậy. Đã có 34 khóa học Public trên thị trường và là đối tác đào tạo phân tích dữ liệu cho các doanh nghiệp lớn tại Việt Nam.