Phân tích dữ liệu: #3 Lấy mẫu và sai số

Đăng bởi Bui Linh vào

Bài viết tiếp theo về phân tích dữ liệu, blogsanxuat sẽ giới thiệu với bạn về phương pháp lấy mẫu và sai số.

Mục đích của việc lấy mẫu là để chúng ta đánh giá chất lượng của những mẫu này. Từ kết quả của mẫu, chúng ta sẽ đánh giá chất lượng của toàn bộ lô hàng.

Phương pháp chọn mẫu

Việc đánh giá mẫu giúp chúng ta tiết kiệm được nhiều thời gian và công sức. Với phương pháp này, chúng ta chỉ cần đánh giá một phần trong tất cả số sản phẩm đã sản xuất. Tuỳ vào từng công ty, hay chủng loại sản phẩm mà số lượng mẫu sẽ khác nhau.

Đầu tiên, tuỳ thuộc vào quy mô của dữ liệu mẹ mà cách lấy mẫu cũng khác nhau.

Có hai trường hợp sẽ xảy ra. Hoặc chúng ta chọn một lô hàng làm mẫu hoặc chọn cả công đoạn làm mẫu.

Các phương pháp chọn mẫu
Các phương pháp chọn mẫu

Như trong hình trên, để đánh giá một lô sản phẩm (Tập dữ liệu mẹ hữu hạn) chúng ta chỉ việc chọn mẫu và lấy dữ liệu.

Còn trong trường hợp chọn đánh giá một công đoạn (Tập hữu hạn mẹ vô hạn). Chúng ta cần chọn một lô sản phẩm trong đó (Mẫu thứ nhất). Sau đó, chọn mẫu cho lô sản phẩm đã định (Mẫu thứ hai) rồi mới thu thập dữ liệu để đánh giá.

Trong một số trường hợp đặc biệt, chúng ta có thể dùng đến lần lấy mẫu thứ ba.

Để đánh giá đúng trạng thái của dữ liệu mẹ, chúng ta cần lấy theo phương pháp ngẫu nhiên. Như thế, kết quả phân tích dữ liệu mới thực sự đáng tin cậy.

Sai lệch và sai số trong phân tích dữ liệu

Những ai đã từng đi thu thập dữ liệu, hoặc có kinh nghiệm đo hàng sẽ thấy. Dữ liệu chúng ta thu được từ mẫu không phải là một giá trị nhất định.

Ví dụ: Khi đo chiều dài của một chi tiết được cắt 50mm. Chúng ta sẽ thu được những giá trị như sau: 49,80 49,90 50,20 50,10 50,00. Sự khác nhau giữa các dữ liệu đo được này được gọi là sai lệch.

Sự sai lệch này thường suất hiện kể cả khi chúng ta đo những sản phẩm giống hệt nhau. Sự khác nhau này gọi là sai số mẫu.

Sai lệch còn có thể phát sinh do trạng thái của dụng cụ đo hay thói quen của người đo. Trường hợp này gọi là sai số đo.

Do đó, dữ liệu sau khi đo mẫu sẽ được tính như sau:

Dữ liệu = Giá trị thực + Sai số mẫu + Sai số đo

Tuy nhiên, giá trị thực trong công thức trên chỉ mang tính khái niệm. Giá trị này thực ra không tồn tại. Bởi vì dù chúng ta có cố gắng điều chỉnh đi chăng nữa cũng không thể cắt đúng 50,00 mm.

 Vì vậy, khi đánh giá dữ liệu chúng ta sẽ sử dụng cả giá trị thực, sai số mẫu và sai số đo. 

0 Bình luận

Trả lời

Avatar placeholder

Email của bạn sẽ không được hiển thị công khai.