Blog
8 phút đọc

Dữ liệu liên tục là gì? Sự khác biệt giữa dữ liệu liên tục & rời rạc

Trong thống kê, dữ liệu được định nghĩa là các dữ kiện và số liệu thu thập cho mục đích phân tích và có thể chia thành 2 loại lớn là dữ liệu định tính và dữ liệu định lượng. Trong đó, dữ liệu định lượng là loại dữ liệu chứa các giá trị số và tiếp tục được phân chia thành 2 loại chính là dữ liệu liên tục và dữ liệu rời rạc. Vậy dữ liệu liên tục là gì? Ở bài viết này, MDA sẽ giúp bạn phân biệt giữa dữ liệu liên tục và dữ liệu rời rạc.

Dữ liệu liên tục là gì?

Ở phần này, chúng tôi sẽ cung cấp cho bạn về định nghĩa và các ví dụ thực tế để có thể hiểu rõ dữ liệu liên tục là gì.

Định nghĩa

Dữ liệu liên tục (Continuous Data) là một thuật ngữ trong thống kê được hiểu là một tập hợp các quan sát không bị gián đoạn và có thể đo lường trên thang điểm. Dữ liệu liên tục không bị giới hạn ở các giá trị riêng biệt và có thể nhận bất kỳ giá trị nào trong một phạm vi liên tục nhất định. Giữa hai giá trị dữ liệu liên tục có thể tồn tại vô số giá trị khác.

Theo lý thuyết, dữ liệu liên tục có thể là số nguyên hoặc số thập phân và được chia thành các phần nhỏ có ý nghĩa tùy theo độ chính xác của phép đo.

Tổng quan dữ liệu liên tục

Tổng quan dữ liệu liên tục

Ví dụ về dữ liệu liên tục

Nếu bạn vẫn chưa hình dung được dữ liệu liên tục là gì thì dưới đây sẽ là những ví dụ minh họa thực tế.

Dữ liệu liên tục thường được biểu diễn bằng các biến số thời gian, biến số đo lường liên tục hoặc các biến số có thể nhận giá trị liên tục trong một khoảng. Ví dụ về dữ liệu liên tục bao gồm thời gian, nhiệt độ, trọng lượng, chiều cao, áp suất, tỷ lệ phần trăm, giá trị tiền tệ,…

Đối với phương pháp lấy mẫu, công cụ đo lường có thể xem là một yếu tố hạn chế đối với dữ liệu liên tục. Ví dụ, nếu một người nói chiều cao của mình 1m65, thì có thể chiều cao của người đó không chính xác là 1m65. Đó chỉ là những gì mà thang đo biểu thị cho họ thấy. Trên thực tế, chiều cao của người này có thể là 1m64,6.

Do đó, nếu bạn thực hiện nghiên cứu thị trường thì nên xem xét cẩn thận về các yếu tố bao gồm quy mô, phép đo, phương pháp thu thập dữ liệu và công cụ thu thập dữ liệu.

Cách hiển thị dữ liệu liên tục bằng biểu đồ

Dữ liệu liên tục thường được biểu diễn bằng các biểu đồ đường (line chart). Biểu đồ này giúp hiển thị sự thay đổi của giá trị theo thời gian, cho phép người dùng phân tích xu hướng, biến động hoặc mối quan hệ giữa các biến số.

Cách hiển thị dữ liệu liên tục

Dữ liệu rời rạc là gì?

Bên cạnh dữ liệu liên tục, dữ liệu rời rạc cũng là một loại dữ liệu quan trọng trong quá trình phân tích thống kê. Vậy dữ liệu rời rạc là gì?

Định nghĩa

Khác với dữ liệu liên tục, dữ liệu rời rạc (Discrete Data) là những giá trị có thể đếm được và không thể đo lường. Nó chỉ chứa các giá trị hữu hạn và không thể chia nhỏ thành các phần. Nói một cách dễ hiểu, dữ liệu rời rạc chỉ bao gồm những giá trị cụ thể được tính bằng số nguyên và không thể chia thành các dạng phân số hoặc số thập phân như dữ liệu liên tục.

Dữ liệu rời rạc

Dữ liệu rời rạc

Ví dụ về dữ liệu rời rạc

Dữ liệu rời rạc bao gồm các giá trị cụ thể như số lượng học sinh trong một lớp học, số lượng nhân viên trong một công ty, số lần xảy ra một sự kiện, số lượng sản phẩm bán ra trong một ngày,…

Ngoài ra, dữ liệu rời rạc cũng có thể là danh mục mà trong đó không tồn tại bất kỳ thứ tự nào giữa các giá trị. Ví dụ như màu sắc có thể bao gồm màu đỏ, xanh, nâu hoặc giới tính bao gồm nam và nữ,…

Cách hiển thị dữ liệu rời rạc bằng đồ thị

Dữ liệu rời rạc có thể được biểu diễn bằng các dạng biểu đồ như biểu đồ thanh (bar chart), biểu đồ hình lá (stem and leaf plot) hoặc biểu đồ hình tròn (pie chart). Biểu đồ này giúp thể hiện sự phân bố và tương quan giữa các giá trị rời rạc.

Cách hiển thị dữ liệu rời rạc trên biểu đồ cột

Cách hiển thị dữ liệu rời rạc trên biểu đồ cột

So sánh dữ liệu liên tục và dữ liệu rời rạc

Mặc dù đều là các loại dữ liệu định lượng nhưng dữ liệu liên tục và dữ liệu rời rạc lại có những đặc điểm và ứng dụng khác nhau. Dưới đây sẽ là bảng so sánh để bạn có thể phân biệt 2 loại dữ liệu này một cách chi tiết và rõ ràng hơn.

Cơ sở so sánh Dữ liệu rời rạc Dữ liệu liên tục
Khái niệm Dữ liệu rời rạc là loại dữ liệu có khoảng trống rõ ràng giữa các giá trị. Dữ liệu liên tục là loại dữ liệu nằm trong một chuỗi liên tục.
Xác định Đếm được. Có thể đo lường.
Giá trị Chỉ nhận các giá trị số nguyên hoặc riêng biệt. Có thể nhận bất kỳ giá trị nào trong một phạm vi liên tục nhất định.
Biểu diễn đồ họa Được biểu diễn bằng biểu đồ thanh. Được biểu diễn bằng đồ thị.
Lập bảng được gọi là Phân phối tần số không nhóm (thực hiện theo 1 giá trị duy nhất) Phân bố tần số theo nhóm (thực hiện theo một nhóm giá trị)
Phân loại Bao gồm lẫn nhau Loại trừ lẫn nhau
Đồ thị hàm số Hiển thị các điểm bị cô lập Hiển thị các điểm được kết nối

Như vậy, bài viết này đã giải thích những kiến thức cơ bản nhất để lý giải dữ liệu liên tục là gì cũng như phân biệt giữa dữ liệu liên tục và dữ liệu rời rạc. MDA hy vọng những thông tin trên sẽ mang đến giá trị hữu ích cho các bạn đọc đang quan tâm về lĩnh vực này. Liên hệ để được tư vấn khóa học Business Intelligence nhanh nhất qua hotline 0961 48 66 48 hoặc Fanpage Mastering Data Analytics.