Nâng trình phân tích dữ liệu kinh doanh bằng những khóa học của MDA
5 Lầm Tưởng Về Dimensional Modeling
Mục Lục
- 1. Dimensional Modeling là gì?
- 2. Những sai lầm về mô hình chiều dữ liệu
- 2.1. Dimensional Modeling chỉ dành cho Dữ liệu tổng hợp (Summary Data)
- 2.2. Chỉ dùng cho cấp Phòng ban, không dùng cho cấp Doanh nghiệp
- 2.3. Không có khả năng Mở rộng (Scalable)
- 2.4. Chỉ dành cho những Nhu cầu được dự đoán trước
- 2.5. Không thể Tích hợp được (Integrated)
Dimensional modeling là tên của một kỹ thuật thiết kế logic thường được sử dụng cho các kho dữ liệu. Do có khá nhiều lầm tường về DM nên Mastering Data Analytics sẽ chỉ ra các sai lầm thường thầy về Dimensional Modeling trong bài viết này nhé!
1. Dimensional Modeling là gì?
Dimensional Modeling (Mô hình chiều dữ liệu) là một kỹ thuật thiết kế logic nhằm tìm cách trình bày dữ liệu trong một khuôn khổ tiêu chuẩn, trực quan cho phép truy cập hiệu suất cao. Nó vốn có chiều, tuân thủ kỷ luật sử dụng mô hình quan hệ với một số hạn chế. Mọi mô hình chiều đều bao gồm một bảng có khóa nhiều phần, được gọi là bảng dữ kiện và một tập hợp các bảng nhỏ hơn được gọi là bảng kích thước. Mỗi bảng thứ nguyên có một khóa chính gồm một phần tương ứng chính xác với một trong các thành phần của khóa nhiều phần trong bảng dữ kiện.
2. Những sai lầm về mô hình chiều dữ liệu
2.1. Dimensional Modeling chỉ dành cho Dữ liệu tổng hợp (Summary Data)
Bạn không thể đoán trước được câu hỏi từ người dùng, vì vậy bạn cần cung cấp cho họ quyền truy vấn đến các dữ liệu chi tiết nhất để người dùng có thể khai thác tùy vào câu hỏi. Dữ liệu tổng hợp giúp cho hiệu suất truy vấn nhanh hơn nhưng không thể thay thế.

2.2. Chỉ dùng cho cấp Phòng ban, không dùng cho cấp Doanh nghiệp
Thay vì vạch ra các ranh giới dựa trên các phòng ban của tổ chức, các mô hình chiều dữ liệu nên được tổ chức xung quanh các quy trình kinh doanh, chẳng hạn như đơn đặt hàng, hóa đơn…

2.3. Không có khả năng Mở rộng (Scalable)
Các mô hình chiều dữ liệu có khả năng mở rộng cực kì lớn. Các bảng thực tế thường có hàng tỷ hàng; các fact table chứa 2 nghìn tỷ hàng.
2.4. Chỉ dành cho những Nhu cầu được dự đoán trước
Các mô chiều dữ liệu không nên được thiết kế bằng cách tập trung vào các báo cáo hoặc phân tích được xác định trước. Thiết kế nên tập trung vào các quy trình đo lường.
2.5. Không thể Tích hợp được (Integrated)
Các mô hình chiều dữ liệu hoàn toàn có thể được tích hợp. Chúng phù hợp với kiến trúc của kho dữ liệu doanh nghiệp.

Xem thông tin khai giảng Khóa học Business Intelligence mới nhất tại Mastering Data Analytics. Liên hệ 0961 48 48 66 hoặc inbox Fanpage Mastering Data Analytics để đăng ký nhanh nhất nhé!
Bài viết liên quan

Omni-channel Marketing Automation – Xu hướng mới trong việc tiếp cận và chuyển đổi khách hàng

Phân tích dữ liệu hệ thống POS giúp Nhà bán lẻ ra quyết định đúng đắn

MySQL là gì? So sánh giữa MySQL và SQL Server

OLTP và OLAP khác nhau ở điểm nào? Có nên kết hợp cả 2 để tối ưu?

Vòng đời dữ liệu – Data Life Cycle là gì? Tầm quan trọng của vòng đời dữ liệu

Tích hợp dữ liệu – Data Integration là gì? Lợi ích của tích hợp dữ liệu

Database Server là gì? Những thông tin cần biết về Máy chủ cơ sở dữ liệu

SQL và NOSQL có gì khác nhau? Nên dùng loại cơ sở dữ liệu nào?

Khóa học Data Analyst: Học phân tích dữ liệu kinh doanh chuyên sâu
