Nâng trình phân tích dữ liệu kinh doanh bằng những khóa học của MDA
5 Lầm Tưởng Về Dimensional Modeling
Mục Lục
- 1. Dimensional Modeling là gì?
- 2. Những sai lầm về mô hình chiều dữ liệu
- 2.1. Dimensional Modeling chỉ dành cho Dữ liệu tổng hợp (Summary Data)
- 2.2. Chỉ dùng cho cấp Phòng ban, không dùng cho cấp Doanh nghiệp
- 2.3. Không có khả năng Mở rộng (Scalable)
- 2.4. Chỉ dành cho những Nhu cầu được dự đoán trước
- 2.5. Không thể Tích hợp được (Integrated)
Dimensional modeling là tên của một kỹ thuật thiết kế logic thường được sử dụng cho các kho dữ liệu. Do có khá nhiều lầm tường về DM nên Mastering Data Analytics sẽ chỉ ra các sai lầm thường thầy về Dimensional Modeling trong bài viết này nhé!
1. Dimensional Modeling là gì?
Dimensional Modeling (Mô hình chiều dữ liệu) là một kỹ thuật thiết kế logic nhằm tìm cách trình bày dữ liệu trong một khuôn khổ tiêu chuẩn, trực quan cho phép truy cập hiệu suất cao. Nó vốn có chiều, tuân thủ kỷ luật sử dụng mô hình quan hệ với một số hạn chế. Mọi mô hình chiều đều bao gồm một bảng có khóa nhiều phần, được gọi là bảng dữ kiện và một tập hợp các bảng nhỏ hơn được gọi là bảng kích thước. Mỗi bảng thứ nguyên có một khóa chính gồm một phần tương ứng chính xác với một trong các thành phần của khóa nhiều phần trong bảng dữ kiện.
2. Những sai lầm về mô hình chiều dữ liệu
2.1. Dimensional Modeling chỉ dành cho Dữ liệu tổng hợp (Summary Data)
Bạn không thể đoán trước được câu hỏi từ người dùng, vì vậy bạn cần cung cấp cho họ quyền truy vấn đến các dữ liệu chi tiết nhất để người dùng có thể khai thác tùy vào câu hỏi. Dữ liệu tổng hợp giúp cho hiệu suất truy vấn nhanh hơn nhưng không thể thay thế.
2.2. Chỉ dùng cho cấp Phòng ban, không dùng cho cấp Doanh nghiệp
Thay vì vạch ra các ranh giới dựa trên các phòng ban của tổ chức, các mô hình chiều dữ liệu nên được tổ chức xung quanh các quy trình kinh doanh, chẳng hạn như đơn đặt hàng, hóa đơn…
2.3. Không có khả năng Mở rộng (Scalable)
Các mô hình chiều dữ liệu có khả năng mở rộng cực kì lớn. Các bảng thực tế thường có hàng tỷ hàng; các fact table chứa 2 nghìn tỷ hàng.
2.4. Chỉ dành cho những Nhu cầu được dự đoán trước
Các mô chiều dữ liệu không nên được thiết kế bằng cách tập trung vào các báo cáo hoặc phân tích được xác định trước. Thiết kế nên tập trung vào các quy trình đo lường.
2.5. Không thể Tích hợp được (Integrated)
Các mô hình chiều dữ liệu hoàn toàn có thể được tích hợp. Chúng phù hợp với kiến trúc của kho dữ liệu doanh nghiệp.
Xem thông tin khai giảng Khóa học Business Intelligence mới nhất tại Mastering Data Analytics. Liên hệ 0961 48 48 66 hoặc inbox Fanpage Mastering Data Analytics để đăng ký nhanh nhất nhé!
Blog mới nhất