Blog Single

Phân tầng dữ liệu: So sánh để tìm điểm khác biệt

Thông thường để điều tra nguyên nhân, chúng ta thường thu thập dữ liệu. Tuy nhiên, nếu chỉ nhìn vào dữ liệu thu được rất khó giúp chúng ta nhìn thấy vấn đề. Vì thế, việc phân tầng dữ liệu sẽ giúp chúng ta sắp xếp dữ liệu theo những mục nhất định, từ đó tìm ra điểm bất thường trong dữ liệu và đào xâu hơn để tìm kiếm nguyên nhân gây ra vấn đề.

1. Định nghĩa

Phân tầng dữ liệu là một công cụ QC phổ biến giúp chia dữ liệu thu thập được hoặc đối tượng điều ra thành nhiều mục để tìm ra điểm khác biệt. Ví dụ, chúng ta có thể chia dữ liệu thu được theo ngày thu thập, theo từng nhân viên thao tác, theo từng máy móc gia công, hay theo từng nguyên vật liệu riêng biệt…

Nói theo một cách đơn giản hơn là Chia nhỏ để hiểu vấn đề. Đây cũng chính là một suy nghĩ vô cùng quan trọng trong quản lý chất lượng Nhật Bản.

Vậy khi nào cần phân tầng dữ liệu? Và chúng ta sẽ thu được gì qua việc này? Mời các bạn xem bảng dưới đây để có câu trả lời.

Sử dụng khi nào? Thông tin thu được
1. Khi chia nhỏ dữ liệu
và tìm điểm khác biệt

2. Khi giải quyết vấn đề
(Nắm bắt hiện trạng,
phân tích nguyên nhân,
thực hiện đối sách,
kiểm tra hiệu quả…)

3. Khi thực hiện một
bản điều tra
(Nắm bắt hiện trạng,
điều tra mức độ hài lòng của
khách hàng
– Hiểu được đặc trưng, khuynh hướng
của từng mục dữ liệu sau khi chia

– Hiểu được điểm chung của
đối tượng điều tra

– Hiểu được mục nào quan trọng nhất

– Hiểu được mục bất thường

– Nhìn ra được đối sách

– Quản lý được các đề mục cần phân tầng

2. Điểm mấu chốt khi phân tầng dữ liệu

Có hai cách để phân chia dữ liệu.

Phân tầng theo kết quả (đặc tính)

Bằng cách phân tầng theo dữ liệu của kết quả chúng ta sẽ tìm ra được điểm khác biệt trong nguyên nhân.

Ví dụ, bằng cách phân chia những chi nhánh có doanh thu cao (kết quả) và chi nhánh có doanh thu thấp chúng ta sẽ nhìn thấy điểm khác biệt trong hoạt động kinh doanh (nguyên nhân) của hai chi nhánh này.

Hoặc, đối với một chi tiết có tỷ lệ hàng lỗi (kết quả) cao, chúng ta có thể phân chia dữ liệu theo ngày có tỷ lệ lỗi cao và thấp để tìm ra sự khác biệt trong máy móc, con người, vật liệu hay phương pháp (nguyên nhân) sử dụng trong ngày đó.

Khi phân tầng theo nguyên nhân

Đây là cách phân tầng theo nguyên nhân để tìm ra điểm khác biệt của đặc tính. Trong trường hợp này, biểu đồ xương cá sẽ là công cụ hữu ích để phân loại các nguyên nhân, là những yếu tố được suy đoán có thể gây ảnh hưởng lớn.

Nếu bạn chưa biết về biểu đồ xương cá có thể tham khảo bài viết dưới nhé.

[su_posts id=”104″ posts_per_page=”-1″ tax_operator=”AND” order=”desc”]

Ví dụ, khi dữ liệu về số lần tới thăm khách hàng (nguyên nhân) nhiều và ít không ảnh hưởng tới doanh số (kết quả) thì chúng ta nên chia dữ liệu theo những nguyên nhân khác như số lượng theo từng chủng loại sản phẩm hay giá bán của từng chủng loại sản phẩm. Bằng cách này chúng ta có thể dễ dàng hơn trong việc tìm ra nguyên nhân cốt lõi ảnh hướng lớn tới doanh số.

Hoặc đối với ví dụ hàng lỗi, nếu không nhìn thấy sự khác biệt về tỉ lệ hàng lỗi của hai nhân viên thì chúng ta nên phân chia dữ liệu theo từng máy riêng biệt, từng vật liệu riêng biệt…

Bảng dưới đây mình sẽ giới thiệu một vài cách chia dữ liệu thường gặp.

Mục phân tầng Cách phân tầng
Theo sản phẩm
riêng biệt
Tên sản phẩm, công ty sản xuất, thiết kế,
độ lớn, khối lượng, giá bán, màu sắc…
Theo đại lý
phân phối
Khu vực, số lượng nhân viên, doanh thu,
số lượng sản phẩm, chi phí quảng cáo…
Theo thời gian Ngày, tháng, năm, quý, buổi sáng, buổi chiều,
ngày trong tuần, cuối tuần…
Theo loại
khách hàng
Nam nữ, nghề nghiệp, tuổi, chức vụ, kinh nghiệm,
tính cách, sở thích, thu nhập…
Theo loại
thiết bị
Nhà sản xuất, chủng loại, kiểu mẫu, mới cũ,
công xưởng, công đoạn, đồ gá sử dụng….
Theo loại vật liệu,
chi tiết
Nhà sản xuất, nơi sản xuất, tên, mã sản phẩm,
hình dạng, vật liệu, thành phần, điều kiện sản xuất..
Theo điều kiện
sản xuất
Kích thước, lô hàng, nơi sản xuất, mục đích sử dụng,
thứ tự sản xuất, phương pháp gia công, tốc độ…
Theo phương pháp
đo đạc
Thiết bị thí nghiệm, thiết bị đo, người đo,
phương pháp đo, người kiểm tra..
Theo môi trường Độ ồn, thông gió, độ sáng, áp xuất, độ ẩm, khí hậu…

3. Các bước phân tầng dữ liệu

Chúng ta thường phân tầng các loại dữ liệu khi muốn tim kiếm nguyen nhân gây ra hàng lỗi hay sai lệch trong chất lượng. Khi đó, chúng ta cần phân loại theo thời gian, công nhân, thiết bị máy móc, nguyên vật liệu, chi tiết sử dụng, phương pháp gia công và điều kiện gia công.

Do không thể biết ngay đâu là yếu tố gây ảnh hưởng lớn nhất nên chúng ta sẽ phải phân tích lần lượt tất cả các yếu tố trên. Tuy nhiên, nếu có kinh nghiệm bạn có thể phân chia lần lượt theo yếu tố mà bạn nghĩ đó là nguyên nhân chính. Nếu không đúng như dự đoán, chúng ta sẽ tiến hành phân tích yếu tố tiếp theo.

Nào bây giờ blogsanxuat sẽ giới thiệu với bạn một ví dụ để chúng ta cùng tìm hiểu về quy trình phân tầng dữ liệu nhé.

BƯỚC 1: Làm sáng tỏ vấn đề cần giải quyết

Một nhân viên QLCL trong một công xưởng muốn tìm ra nguyên nhân để giảm số hàng lỗi trong một công đoạn. Việc đầu tiên anh A làm là thu thập dữ liệu về só hàng lỗi. Ở đây, anh A đã làm sáng tỏ hai điều: 

  • Vấn đề cần giải quyết: Giảm số lượng sản phẩm lỗi trong công đoạn.
  • Dữ liệu cần thu thập: Dữ liệu về sản phẩm lỗi.

BƯỚC 2: Quyết định những đề mục để phân tầng

Trước khi phân tích dữ liệu, việc quyết định các đề mục để phân tầng các loại dữ liệu là rất quan trọng. Anh A đã suy nghĩ và viết ra danh sách những đề mục có thể phân chia được, rồi quyết định những đề mục có khả năng sẽ là nguyên nhân. Việc quyết định các đề mục này phần lớn phục thuộc vào việc chúng ta muốn biết điều gì.

Dưới đây là bảng các đề mục anh A đã lựa chọn

Phân loại Đề mục
Theo thiết bị Máy kiểu A, máy kiểu B
Theo công nhân Anh B, anh C, anh D, anh E
Theo ngày sản xuất Thứ hai ~ thứ sáu
Theo thời gian Buổi sáng, buổi chiều
Theo nội dung hàng lỗi Ngoại quan, kích thước,
vật liệu, công đoạn cuối

BƯỚC 3: Thu thập dữ liệu

Dưới đây là bảng dữ liệu anh A thu thập được trong một tuần.

Bảng dữ liệu thu thập được
Bảng dữ liệu thu thập được

BƯỚC 4: Phân tích dữ liệu và tìm nguyên nhân

Bây giờ anh A đã sử dụng những công cụ QC đã học để trực quan hoá dữ liệu và tìm kiếm điểm khác biệt. Dưới đây là 3 loại đồ thị anh A dùng để khảo sát.

Phân loại dữ liệu theo kiểu máy
Phân loại dữ liệu theo kiểu máy
Phân loại dữ liệu theo từng công nhân
Phân loại dữ liệu theo từng công nhân
Phân loại dữ liệu theo loại lỗi
Phân loại dữ liệu theo loại lỗi

Từ ba đồ thị trên chúng ta có thể thấy những sự khác biệt sau:

  • Số lượng lỗi tại máy kiểu A lớn hơn máy kiểu B.
  • Anh B là vị trí phát sinh nhiều hàng lỗi nhất.
  • Lỗi xước là loại lỗi nhiều nhất.

Từ những sự khác biệt này chúng ta sẽ đào xâu hơn để tìm nguyên nhân gây ra lỗi. Ví dụ như đặt câu hỏi tại sao máy A lại có nhiều lỗi hơn? hay sản phẩm trong quá trình gia công bị va chạm vào đâu mà lại bị xước nhiều như vậy? Những câu hỏi như vậy sẽ là điểm bắt đầu để chúng ta tìm hiểu tiếp.

Như vậy, các bạn đã nắm được tầm quan trọng và mục đích của việc phân tầng dữ liệu rồi phải không? Blogsanxuat hi vọng rằng, sau khi đọc xong bài viết này, bạn sẽ không còn phải ngụp lặn nhiều trong đống dữ liệu đã thu thập./

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *