Nâng trình phân tích dữ liệu kinh doanh bằng những khóa học của MDA
[4] Những công nghệ Phân tích dữ liệu dẫn đầu thế giới
Tiếp theo bài viết [3] về chủ đề: Sự khác nhau chức danh Data Analyst (Business Intelligence) # Data Scientist (Business Analytics) trong bài viết trước. Hôm nay mình sẽ chia sẻ về những công nghệ trong ngành Data Analytics, mà các Data Analyst/ Data Scientist sử dụng để thực hiện công việc phân tích dữ liệu.
Bảng xếp hạng công nghệ phân tích dữ liệu đang dẫn đầu trên thế giới
Có 2 bảng xếp hạng được tham khảo phổ biến nhất, được công bố hàng năm (thường vào quý 1 hàng năm)
1. Bảng xếp hạng Gartner biểu thị công nghệ phân tích dữ liệu
Gartner có rất nhiều bảng xếp hạng khác nhau, bên dưới chỉ là 2 bảng xếp hạng liên quan về Business Intelligence & Business Analytics thôi
- Magic Quadrant for Analytics & Business Intelligence Platforms
- Magic Quadrant for Data Science and Machine learning Platforms
2. Machine Learning, AI and Data (MAD) Landscape
Bảng xếp hạng Landscape này này không chỉ có ngành Data, mà cách ngành khác cũng hay thấy (ví dụ anh/chị có thể tìm Marketing Technology Landscape).
Giải thích 2 bảng xếp hạng công nghệ phân tích dữ liệu nổi tiếng: Gartner & Data Landscape
1. Gartner
1.1. Nhà cung cấp hàng đầu
Gartner lựa chọn 20 nhà cung cấp (providers) dẫn đầu thế giới trong để đưa vào các bảng xếp hạng, chia thành 4 nhóm:
- Niche Players
- Challengers
- Visionaries
- Leaders
1.2. 4 nhóm này sẽ được đánh giá theo 2 tiêu chí
- Ability to execute (khả năng thực thi/ công nghệ có thân thiện, dễ sử dụng không?)
- Completeness of Vision (Tầm nhìn, khả năng đáp ứng nhu cầu phân tích trong tương lai)
Công nghệ nào được giá cao cả 2 điều kiện này sẽ được ghi nhận như LEADERs trong ngành.
1.3. Một số thông tin thêm về bảng xếp hạng trên
Microsoft (Power BI & Excel), Tableau (đã được Salesforce mua lại vài năm gần đây), Qlik là 3 công nghệ dẫn đầu toàn thế giới về mảng Business Intelligence. Những năm đầu, Tableau + Qlik dẫn đầu, nhưng trong tầm 5 năm gần đây, với sự đầu tư, nghiên cứu liên tục thì Microsoft (Power BI & Excel) đã vươn lên vị trí TOP 1. Khoảng cách ngày càng xa những công nghệ còn lại, cập nhật hàng tháng (các công nghệ khác đa phần cập nhật hàng quý) .
Như bài viết trước trong Series này, mình có chia sẻ Certificate của mình trong mảng Advance Analytics; mình cũng đã dùng Alteryx nhiều năm và thi passed Core + Advance. Ngày xưa phải code nhiều khá lười, từ khi dùng Alteryx các chức năng/ thuật toán được tích hợp thành nút/icons kiểu như hình bên dưới thì dùng thấy khỏe hơn. Cái gì cần lắm thì mới code (Alteryx có tích hợp ngôn ngữ lập trình trong tool để tăng khả năng linh hoạt).
Nhìn vào hình 3, Alteryx được Gartner đánh giá là khá dễ sử dụng, thân thiện người dùng. Tuy nhiên, hiện tại các loại phân tích dữ liệu tại Alteryx đang mạnh hơn về phân tích loại dữ liệu có cấu trúc (Structure Data). Trong khi tầm nhìn Gartner phải phát triển mạnh thêm các kĩ thuật phân tích dữ liệu phi cấu trúc (Unstructure Data). Nên 2021 Gartner loại Alteryx ra top Leaders (theo hình 1 phân loại 4 nhóm), dù năm 2020 Alteryx vẫn thuộc Leaders.
2. Bảng xếp hạng MAD Landscape
SQL/R/Python không thấy trong bảng xếp hạng Gartner?
Nhìn vào bảng xếp hạng Gartner bên trên, một số anh/chị sẽ thắc mắc vậy SQL/R/Python (hay được nghe khi nhắc về ngành Data Analytics) không thấy trong bảng xếp hạng? Vậy nó ở đâu? Gartner chỉ đưa Providers (công nghệ được doanh nghiệp phát triển, chịu trách nhiệm triển khai…) vào danh sách còn những công nghệ Open sources (đa phần miễn phí). Không phải nhà cung cấp chính thức thì Gartner không đưa vào.
Tuy nhiên, nhìn vào bảng xếp hạng Machine Learning, AI and Data (MAD) Landscape thì tổng quát và nhiều công nghệ hơn. Mọi người sẽ thấy SQL/R/Python trong bảng xếp hạng những công nghệ nổi bật trong ngành.