NỘI DUNG
Dữ liệu là thông tin về một cái gì đó chỉ ra một đặc điểm nhất định. Các loại dữ liệu khác nhau sẽ có cách thu thập dữ liệu khác nhau. Hiếu rõ ràng sẽ giúp tránh sai sót trong việc thu thập dữ liệu.
Các loại dữ liệu
Dữ liệu liên tục (Continouos data)
- Là dữ liệu dạng định lượng (có thể là số nguyên hoặc số thập phân)
- Dữ liệu được đo bằng dụng cụ đo.
- Có thể đo lường (thang đo hoặc công cụ).
- Chia nhỏ vô tận (về lý thuyết).
- Độ chính xác phụ thuộc vào độ chính xác của thiết bị đo.
Ví dụ
- Số lượng cuộc gọi
- Thời gian chờ giao hàng
- Thời gian sản xuất
- Chi phí
- Giá cả
- Nhiệt độ, chiều dài,
- Thời gian (Giờ, Phút và Giây)
- Chiều cao (Feet, Inch, Phân số của inch, v.v.)
- Trọng lượng (Kg, Gram, v.v.)
- Tiền (Đô la, Yên, Euro và các phần nhỏ của chúng
Để dễ nhớ, có thể hiểu dữ liệu liên tục là những số đếm có giá trị max min.
Dữ liệu rời rạc (Discrete Data)
- Chỉ rời rạc hoặc hữu hạn số lượng giá trị chỉ đếm được và không đo được.
- Là số nguyên.
- Có thể phân loại thành một phân loại (ví dụ màu)
- Không thể chia nhỏ thành các đơn vị nhỏ hơn
Cần đào tạo, tư vấn cải tiến nhà máy, cải tiến công đoạn sản xuất, Kaizen mời liên hệ Tel 0919 099 777 Email: tuvandaotaotriphuc@gmail.com
Ví dụ
- Có bao nhiêu người có thể ngồi thoải mái trong một chiếc máy bay?. Không có nghĩa gì khi nói 129.7632213 người. Nó là 129 hoặc 130, trong trường hợp này bạn sẽ làm tròn xuống 129.
- xếp hạng được cung cấp trên FMEAvề Mức độ nghiêm trọng, Sự xuất hiện và Phát hiện
- Màu xanh, đỏ…
- giới tính
- chủng tộc
- số lỗi trên một mẫu đơn đặt hàng hoặc trong một loạt các bộ phận
- đảng phái chính trị (được coi là dữ liệu phân loại rời rạc)
- số lượng sinh viên hoặc công nhân
- số lượng máy
- các loại lỗi trên một mẫu đơn đặt hàng
- số lần giao hàng trễ
Biểu đồ thanh, biểu đồ hình tròn và biểu đồ Thân và Lá là những lựa chọn tốt cho dữ liệu rời rạc.
Dữ liệu khoảng cách (Interval Data)
- Là thang đo thứ bậc, Có đặc tính số lượng, có khoảng cách đều và liên tục. Bao gồm tất cả các đặc điểm của thang đo thứ tự
- Dữ liệu ở 2 cực của khoảng thể hiện trạng thái đối nghịch nhau
Ví dụ về thang đo khoảng là nhiệt độ độ C vì chênh lệch giữa mỗi giá trị là như nhau.
Sự khác biệt giữa 20 và 30 độ là 10 độ có thể đo được, cũng như sự khác biệt giữa 50 và 40 độ.
1. Hoàn toàn đồng ý 2. đồng ý 3. Không đồng ý 4. Phản đối
- 0 -> 20000 Euro
- 20000 -> 40000 Euro
- 40000 -> 60000 Euro
- 60000 -> 80000 Euro
Ở đây “khoảng cách” giữa các giá trị là 20000 euro
Dữ liệu tỷ lệ (Ratio Data)
- Là loại thang đo có đặc tính số lượng. Có đầy đủ đặc tính của dữ liệu khoảng nhưng có thêm tỷ lệ so sánh giữa 2 biến số.
Ví dụ: Nếu mặt số trên cân hiển thị số 0, thì hoàn toàn không có trọng lượng
- Nếu anh X kiếm được 6000 usd/ tháng và anh Y kiếm được 2000 usd/tháng. Thì anh X kiếm được gấp 3 lần anh Y.
Dữ liệu nhị thức (binomial)
chỉ có 2 đặc điểm
- go / no go
- đạt/không đạt
- Tốt/xấu
- vượt qua thất bại
- bật / tắt
- đúng / sai
- toàn trống rỗng
- nóng lạnh
- nhỏ to
- giấy/nhựa
Dữ liệu định danh (Nominal Data)
- Dữ liệu chỉ sử dụng biến tên thay vì giá trị số. Dùng phân loại đối tượng
- Dữ liệu không có thứ tự
Ví dụ
- Hướng – Bắc, Đông, Tây & Nam
- Màu sắc – Xanh lục, Đỏ, Vàng
- Giới tính: nữ, nam
Dữ liệu thứ bậc (Ordinal Data)
- Dữ liệu định tính với một tập hợp/Thứ tự tự nhiên, sắp xếp tăng dần hoặc giảm dần.
- Dữ liệu không có tiêu chuẩn
- Dữ liệu có thể được đo bằng cả Số và Tên
Ví dụ
Các lớp: F, E, D, C, B, A
Tháng- Tháng 1, Tháng 2,,…, Tháng 12
Độ sáng: Sáng, Trung bình & Tối
Học lực: yếu, kém trung bình, khá, giỏi, xuất sắc
So sánh các loại dữ liệu với nhau
- Dữ liệu liên tục chính xác hơn dữ liệu rời rạc.
- Dữ liệu liên tục cung cấp nhiều thông tin hơn dữ liệu rời rạc.
- Dữ liệu liên tục có thể loại bỏ ước tính và làm tròn các phép đo.
- Dữ liệu liên tục thường tốn nhiều thời gian hơn để có được.
Chuyển dữ liệu liên tục sang rời rạc
Hạng mục đo | Dữ liệu rời rạc /thuộc tính
Discrete data |
Dữ liệu liên tục (contiunous data) |
Thùng gas | Đầy/rỗng | 100L/thùng |
Chiều cao của cây | Ngắn/trung bình/cao | 154,3m hoặc 174m |
Năng suất | Tốt/xấu/trung bình | 1700 cái/giờ |
Nhiệt độ | Lạnh/ấm/nóng | 15oC/26oC |
Cần đào tạo, tư vấn cải tiến nhà máy, cải tiến công đoạn sản xuất, Kaizen mời liên hệ Tel 0919 099 777 Email: tuvandaotaotriphuc@gmail.com
Ví dụ
- Thay vì ghi lại việc học sinh ĐẠT hay KHÔNG ĐẠT trong kỳ thi SAT, sẽ tốt hơn nếu có điểm thực tế của từng học sinh trong kỳ thi SAT.
- Thu thập dữ liệu về thời gian vận chuyển. Có thể ghi lại từng lô hàng là trễ hoặc đúng
- Hoặc nhóm từng lô hàng là đến sớm 0-1 ngày, sớm 2-3 ngày, trễ 0-1 ngày, trễ 2-3 ngày.
- Hoặc Rất sớm, Sớm, Đúng giờ, Trễ hoặc Rất muộn.
- Nếu chỉ thu thập dữ liệu tiền và phế liệu ở mỗi máy thì có các kết luận khác nhau. Nếu so sánh tỷ lệ tiền/phế sẽ biết được máy nào cần cải tiến
Đọc thêm