Khi tiếp cận với việc tổ chức cơ sở dữ liệu (database), các bạn mới sẽ cảm thấy choáng ngợp với quá nhiều thuật ngữ. Mình sẽ giải thích qua về ý nghĩa của những thuật ngữ này một cách cơ bản để mọi người có thể hiểu. Từ đó, bạn sẽ chọn được cách thiết kế nào phù hợp với doanh nghiệp của mình.

1. Database

Đầu tiên là Database. Mọi người cần hiểu rằng Database là những source dữ liệu. Ví dụ như dữ liệu từ Facebook, hệ thống bán hàng CRM, máy POS… Những source dữ liệu như thế được gọi là database. Đó là những dạng dữ liệu có cấu trúc, bảng biểu rõ ràng.

2. Data Warehouse

Mọi người thường sẽ tập trung những dữ liệu có cấu trúc đổ vào 1 nơi gọi là Data Warehouse. Chúng ta sẽ hiểu rằng Data Warehouse là một nơi tập trung tất cả dữ liệu trong công ty. Đó là nơi đổ dữ liệu về của các phòng ban Marketing, Sales, HR, Finance…

3. Data Mart

Từ Data Warehouse người ta mới phân ra thành những Data Mart. Ví dụ, bạn làm sale thì bạn chỉ tiếp cận được chừng này bảng dữ liệu. Từng phòng ban, từng nhân sự sẽ được tiếp cận tới những bảng dữ liệu mà mình được phân quyền.

4. Data Lake

Data Lake sẽ tập trung chủ yếu vào những dữ liệu phi cấu trúc như âm thanh, hình ảnh, video… Những dữ liệu này sẽ được cung cấp cho các nhà phân tích dữ liệu (data analyst) khi cần thiết.

5. Data Lakehouse, Data Fabric, Data Mesh

Đây là những cấu trúc gọi là tổ chức cơ sở dữ liệu rất là tiên tiến hiện nay. Thông thường nó sẽ bao gồm cả dữ liệu có cấu trúc và phi cấu trúc. Đối với mỗi cách như Lakehouse, Fabric hoặc Mesh sẽ có những cơ chế đẩy hoặc quản lý dữ liệu khác nhau. Nó sẽ tối ưu cho từng mục đích sử dụng.

Hiện nay, phần lớn các doanh nghiệp ở Việt Nam đang tập trung vào phân tích dữ liệu có cấu trúc trước. Sau khi đã làm được phân tích dữ liệu có cấu trúc 1 cách bài bản mình sẽ đi đến bước kế tiếp. Đó là phân tích theo những dữ liệu phi cấu trúc, khi đó mình sẽ dùng đến những nền tảng như Lakehouse, Fabric hay Mesh.

Xem ngay video TikTok do cô Phương Thảo chia sẻ để hiểu hơn về chủ đề này:

@phuongthaoanalytics

Bạn đã biết hết các thuật ngữ này chưa? #phuongthaodataanalytics #businessanalyst #dataanalytics #daloteam #masteringdataanalytics #data #database #datawarehouse #business #learnontiktok

♬ nhạc nền – Phuong Thao Analytics – Phuong Thao Analytics

Xem thêm bài viết khác tại đây:

Mastering Data Analytics tự hào là đơn vị đào tạo Kỹ năng Phân tích Dữ liệu Kinh doanh hàng đầu Việt Nam. Các khóa học Phân tích Dữ liệu Kinh doanh được khai giảng định kỳ hàng tháng. Với hai hình thức học: Online và Offline tạo điều kiện cho học viên linh hoạt sắp xếp thời gian. Truy cập Khóa học Business Intelligence để biết lịch khai giảng gần nhất. Với mọi thắc mắc về khóa học bạn có thể inbox Fanpage Mastering Data Analytics hoặc liên hệ hotline 0961 48 66 48 để được giải đáp miễn phí!