Thứ Ba, 3 tháng 9, 2013

Biểu đồ phân tán (Scatter Diagram)

1. Khái niệm
     Biểu đồ phân tán (biểu đồ tán xạ) là một kỹ thuật đồ thị để nghiên cứu mối quan hệ giữa hai bộ số liệu liên hệ xảy ra theo cặp. Biểu đồ phân tán trình bày các cặp như một đám mây điểm. Mối liên hệ giữa các bộ số liệu liên hệ được suy ra từ hình dạng các đám mây đó.
2. Tác dụng
     Dùng để phát hiện và trình bày các mối quan hệ giữa hai bộ số liệu có liên hệ hoặc để xác nhận/bác bỏ mối quan hệ đoán trước giữa hai bộ phận có liên hệ.
3. Các bước cơ bản để thiết lập biểu đồ phân tán.
     Bước 1: Chọn mẫu, mẫu nên có khoảng 30 quan sát trở lên.
     Bước 2: Vẽ đồ thị.
     Bước 3: Kiểm tra hình dạng của đám mây để phát hiện ra loại và mức độ của các mối quan hệ đó.
4. Cách đọc biểu đồ.
     Dưới đây là năm dạng hay xảy ra nhất. bằng việc kiểm tra hình dạng của đám mây người ta có thể xác định mối quan hệ giữa các bộ số liệu này.
 X tăng thì Y tăng một cách tỉ lệ thuận. Nếu kiểm soát được X tất nhiên kiểm soát được Y.
  Tăng X thì sẽ làm giảm Y một cách tỉ lệ. Vì vậy, nếu kiểm soát được X thì cũng kiểm soát được Y.
  X tăng thì Y tăng nhưng hình như Y còn phụ thuộc các nguyên nhân khác.
  Tăng X sẽ làm giảm Y nhưng hình như Y còn phụ thuộc các nguyên nhân khác.
   Không có mối quan hệ giữa X và Y.
Lưu ý: Trong một số trường hợp, do nhiều nguyên nhân thoạt nhìn ta tưởng hai biến số có dường như có quan hệ nhưng thực ra chúng không quan hệ gì với nhau và ngược lại. Chính vì thế, cần quan tâm đến nguồn gốc cách thu thập số liệu để tiện cho việc phân vùng cũng như phân tích số liệu sau này.
5. ví dụ.
     Giả sử văn phòng của chúng ta tổ chức làm việc theo thời gian linh động. Quý vị có thể đến sở bất kỳ giờ nào giữa 7h30 và 9h30 sáng và ra về sau đó 8 tiếng rưỡi.
     Sau một tháng, quý vị rời nhà ở những thời gian khác nhau nằm giữa 7h đến 9h sáng và ghi nhận sẽ mất bao lâu để đến văn phòng. Trên biểu đồ phân tán, hai biến số cho thấy một mối quan hệ rõ rệt.
 Nhìn biểu đồ ta thấy, rời nhà trước 7h30 hoặc sau 8h30 sẽ đỡ mất thời gian lái xe. Qua đó căn cứ sở thích, ví dụ cần tắm rửa, uống cà phê, chúng ta sẽ đăng ký được giờ làm việc từ 9h30 sáng đến 6h chiều.
Nguồn: sưu tầm.

Chủ Nhật, 1 tháng 9, 2013

Biểu đồ phân bố tần số (Histograms)

1. Khái niệm
     Biểu đồ phân bố tần số (còn được gọi là biểu đồ phân bố mật độ, biểu đồ cột) dùng để đo tần số xuất hiện của một vấn đề nào đó, cho ta thấy rõ hình ảnh sự thay đổi, biến động của một tập dữ liệu.
     Biểu đồ này do nhà thống kê người pháp, Andre Michel Guerry giới thiệu trong buổi thuyết trình vào năm 1833 để mô tả sự phân tích của ông về số liệu tội phạm theo từng tiêu chí giúp người nghe dễ dàng hình dung vấn đề.
     Trong biểu đồ phân bố tần số, trục hoành biểu thị các giá trị đo; trục tung biểu thị số lượng các chi tiết hay số lần xuất hiện; bề rộng của mỗi cột bằng khoảng phân lớp; chiều cao của mỗi cột nói lên số lượng chi tiết (tần số) tương ứng với mỗi phân lớp.
     Ba đặc trưng quan trọng của biểu đồ phân bố tần số là tâm điểm, độ rộng, độ dốc.
2. Tác dụng
     Cung cấp thông tin trực quan về biến động của quá trình, tạo hình đặc trưng "nhìn thấy được" từ những con số tưởng chừng vô nghĩa. là công cụ hữu ích khi cần phân tích dữ liệu lớn.
     Thông qua hình dạng phân bố so sánh được các giá trị tiêu chuẩn với phân bố của biểu đồ, tổ chức có thể kiểm tra và đánh giá khả năng của các yếu tố đầu vào, kiểm soát quá trình, phát hiện sai sót.
3. Các bước cơ bản để thiết lập biểu đồ phân bố.
     Bước 1: Thu thập giá trị các số liệu. Đếm lượng số liệu (n). n > 50 mới tốt.
     Bước 2: Tính toán các đặc trưng thống kê.
  - Xác định độ rộng của toàn bộ số liệu
     R=Xmax-Xmin
  - Xác định số lớp (k) và độ rộng (h) của một lớp.
   . Số lớp (số khoảng) là một số nguyên, thường được ước lượng bằng nhiều công thức khác nhau dựa vào kinh nghiệm và tùy thuộc vào đặc điểm của hiện tượng nghiên cứu. 
   Theo Douglas C.Montgomery: k =√n 
   . Độ rộng của một lớp (h): h = R/k
 để thuận tiện cho việc tính toán, h thường được làm tròn số (theo hướng tăng lên) và khi đó số lớp (k) cũng thay đổi theo.
  - Xác định biên độ trên (BĐT) và Biên độ dưới (BĐD) của các lớp.
    . Lớp đầu tiên. 
  D= Xlow
Xlow: giá trị thuận tiện nhỏ hơn Xmin một ít.
     Xlow = Xmin - h/2
BĐT1D1 + h
    . Lớp thứ hai.
D2 BĐT1
BĐT2 D2 + h
    . Tiếp tục như thế cho những lớp tiếp theo cho tới lớp cuối cùng chứa giá trị đo lớn nhất.
  - Lập bảng tần suất.
   . Tính giá trị trung tâm của từng lớp.

 Xoi = (BĐDi + BĐTi)/2
   . Đếm số dữ liệu xuất hiện trong mỗi lớp.
     Bước 3: Vẽ biểu đồ phân bố tần số.
 Đánh dấu trục hoành theo thang giá trị số liệu, trục tung theo thang tần số (số lần hoặc phần trăm số lần xuất hiện). Vẽ các cột tương ứng với các giới hạn của lớp, chiều cao của cột tương ứng với tần số lớp.
4. Cách đọc biểu đồ phân bố tần số.
   Có 2 phương pháp cơ bản về cách đọc biểu đồ tần số.
- Cách thứ nhất: dựa vào dạng phân bố
Biểu đồ phân bố thường có dạng phân bố đối xứng, hình chuông. Chính vì thế, hình dạng, "độ trơn" của biểu đồ được dùng để đánh giá khả năng của quá trình nhằm phát hiện ra những nguyên nhân đặc biệt đang tác động đến quá trình từ đó đưa ra các điều chỉnh, cải tiến cụ thể cho quá trình.
Dưới đây là một số dạng cơ bản của biểu đồ phân bố.
 
  
 
   - Cách thứ hai: So sánh các giá trị tiêu chuẩn với phân bố của biểu đồ. Ta đưa ra các so sánh tỉ lệ phế phẩm so với tiêu chuẩn; giá trị trung bình có trùng với đường tâm của hai giới hạn không; hình dạng biểu đồ lệch qua phải hay qua trái từ đó đưa ra quyết định làm giảm sự phân tán hay xét lại tiêu chuẩn.
                                         









 5. Ví dụ.
  Chúng ta thu thập dữ liệu của 100 ngày đi làm, thời gian lái xe đến văn phòng như sau:
   Dữ liệu cho thấy rằng chuyến lâu nhất là 32 phút, chuyến nhanh nhất là 15 phút. Trừ hai chuyến kể trên thì tất cả rơi vào giữa 15 và 25 phút. 
   Từ đó ta xác định được biểu đồ phân bố tần số như sau:

Ví dụ: Nhằm xác định chính xác các kích thước của vật liệu kim loại có liên quan tới quá trình công nghệ gia công nhiệt đang sử dụng, bộ phận kỹ thuật tiến hành ghi chép hệ số biến dạng của vật liệu kim loại trong quá trình nhiệt luyện lấy 100 mẫu, thu được các số liệu như sau:
Đơn vị: % biến dạng.
Yêu cầu: vẽ biểu đồ phân bố tần số và cho nhận xét.
 Bài làm:
Ta có: Xmax = 1.8
          Xmin  = 0.1
R = Xmax - Xmin = 1.7
k = 10
h = 0.17
Khi đó: 
Như vậy là có 11 lớp > Đếm số dữ liệu trong mỗi lớp.

Từ các dữ liệu trên ta vẽ được biểu đồ dưới đây.
Nhận xét:
Đây là biểu đồ dạng răng cưa.