Chủ Nhật, 1 tháng 9, 2013

Biểu đồ phân bố tần số (Histograms)

1. Khái niệm
     Biểu đồ phân bố tần số (còn được gọi là biểu đồ phân bố mật độ, biểu đồ cột) dùng để đo tần số xuất hiện của một vấn đề nào đó, cho ta thấy rõ hình ảnh sự thay đổi, biến động của một tập dữ liệu.
     Biểu đồ này do nhà thống kê người pháp, Andre Michel Guerry giới thiệu trong buổi thuyết trình vào năm 1833 để mô tả sự phân tích của ông về số liệu tội phạm theo từng tiêu chí giúp người nghe dễ dàng hình dung vấn đề.
     Trong biểu đồ phân bố tần số, trục hoành biểu thị các giá trị đo; trục tung biểu thị số lượng các chi tiết hay số lần xuất hiện; bề rộng của mỗi cột bằng khoảng phân lớp; chiều cao của mỗi cột nói lên số lượng chi tiết (tần số) tương ứng với mỗi phân lớp.
     Ba đặc trưng quan trọng của biểu đồ phân bố tần số là tâm điểm, độ rộng, độ dốc.
2. Tác dụng
     Cung cấp thông tin trực quan về biến động của quá trình, tạo hình đặc trưng "nhìn thấy được" từ những con số tưởng chừng vô nghĩa. là công cụ hữu ích khi cần phân tích dữ liệu lớn.
     Thông qua hình dạng phân bố so sánh được các giá trị tiêu chuẩn với phân bố của biểu đồ, tổ chức có thể kiểm tra và đánh giá khả năng của các yếu tố đầu vào, kiểm soát quá trình, phát hiện sai sót.
3. Các bước cơ bản để thiết lập biểu đồ phân bố.
     Bước 1: Thu thập giá trị các số liệu. Đếm lượng số liệu (n). n > 50 mới tốt.
     Bước 2: Tính toán các đặc trưng thống kê.
  - Xác định độ rộng của toàn bộ số liệu
     R=Xmax-Xmin
  - Xác định số lớp (k) và độ rộng (h) của một lớp.
   . Số lớp (số khoảng) là một số nguyên, thường được ước lượng bằng nhiều công thức khác nhau dựa vào kinh nghiệm và tùy thuộc vào đặc điểm của hiện tượng nghiên cứu. 
   Theo Douglas C.Montgomery: k =√n 
   . Độ rộng của một lớp (h): h = R/k
 để thuận tiện cho việc tính toán, h thường được làm tròn số (theo hướng tăng lên) và khi đó số lớp (k) cũng thay đổi theo.
  - Xác định biên độ trên (BĐT) và Biên độ dưới (BĐD) của các lớp.
    . Lớp đầu tiên. 
  D= Xlow
Xlow: giá trị thuận tiện nhỏ hơn Xmin một ít.
     Xlow = Xmin - h/2
BĐT1D1 + h
    . Lớp thứ hai.
D2 BĐT1
BĐT2 D2 + h
    . Tiếp tục như thế cho những lớp tiếp theo cho tới lớp cuối cùng chứa giá trị đo lớn nhất.
  - Lập bảng tần suất.
   . Tính giá trị trung tâm của từng lớp.

 Xoi = (BĐDi + BĐTi)/2
   . Đếm số dữ liệu xuất hiện trong mỗi lớp.
     Bước 3: Vẽ biểu đồ phân bố tần số.
 Đánh dấu trục hoành theo thang giá trị số liệu, trục tung theo thang tần số (số lần hoặc phần trăm số lần xuất hiện). Vẽ các cột tương ứng với các giới hạn của lớp, chiều cao của cột tương ứng với tần số lớp.
4. Cách đọc biểu đồ phân bố tần số.
   Có 2 phương pháp cơ bản về cách đọc biểu đồ tần số.
- Cách thứ nhất: dựa vào dạng phân bố
Biểu đồ phân bố thường có dạng phân bố đối xứng, hình chuông. Chính vì thế, hình dạng, "độ trơn" của biểu đồ được dùng để đánh giá khả năng của quá trình nhằm phát hiện ra những nguyên nhân đặc biệt đang tác động đến quá trình từ đó đưa ra các điều chỉnh, cải tiến cụ thể cho quá trình.
Dưới đây là một số dạng cơ bản của biểu đồ phân bố.
 
  
 
   - Cách thứ hai: So sánh các giá trị tiêu chuẩn với phân bố của biểu đồ. Ta đưa ra các so sánh tỉ lệ phế phẩm so với tiêu chuẩn; giá trị trung bình có trùng với đường tâm của hai giới hạn không; hình dạng biểu đồ lệch qua phải hay qua trái từ đó đưa ra quyết định làm giảm sự phân tán hay xét lại tiêu chuẩn.
                                         









 5. Ví dụ.
  Chúng ta thu thập dữ liệu của 100 ngày đi làm, thời gian lái xe đến văn phòng như sau:
   Dữ liệu cho thấy rằng chuyến lâu nhất là 32 phút, chuyến nhanh nhất là 15 phút. Trừ hai chuyến kể trên thì tất cả rơi vào giữa 15 và 25 phút. 
   Từ đó ta xác định được biểu đồ phân bố tần số như sau:

Ví dụ: Nhằm xác định chính xác các kích thước của vật liệu kim loại có liên quan tới quá trình công nghệ gia công nhiệt đang sử dụng, bộ phận kỹ thuật tiến hành ghi chép hệ số biến dạng của vật liệu kim loại trong quá trình nhiệt luyện lấy 100 mẫu, thu được các số liệu như sau:
Đơn vị: % biến dạng.
Yêu cầu: vẽ biểu đồ phân bố tần số và cho nhận xét.
 Bài làm:
Ta có: Xmax = 1.8
          Xmin  = 0.1
R = Xmax - Xmin = 1.7
k = 10
h = 0.17
Khi đó: 
Như vậy là có 11 lớp > Đếm số dữ liệu trong mỗi lớp.

Từ các dữ liệu trên ta vẽ được biểu đồ dưới đây.
Nhận xét:
Đây là biểu đồ dạng răng cưa.

26 nhận xét:

  1. bạn cho mình hỏi k=10 sao cuỗi cung lại có 11 lop vậy, thứ 2 là nếu số dữ liệu là 60 thì k= căn 60 sáp xỉ 8 phải ko bạn

    Trả lờiXóa
    Trả lời
    1. Số lớp (k) lấy theo căn bậc 2 của n là ước lượng thôi bạn. Số k thực tế lấy theo số biến động dưới và biến động trên mới chính xác bạn ah.

      Xóa

    2. Biến động dưới và biến động trên là sao a?

      Xóa
    3. BĐD: là giá trị mẫu nhỏ nhất trong 1 lớp.
      BĐT: là giá trị mẫu lớn nhất trong 1 lớp.

      Xóa
  2. Sau khi vẽ được biểu đồ rồi thì những hình chuông, 2 đỉnh thì phân tích dữ liệu như thế nào anh có thể nói rõ hơn được không anh?>

    Trả lờiXóa
    Trả lời
    1. Bạn nhận xét theo biểu đồ đó thôi:
      Hình chuông : đỉnh lớn nhất tại giá trị mẫu là bao nhiêu. và sai xót tập trung chủ yếu ở khoảng giữa.
      Hai đỉnh: Bạn nhận xét giá trị đỉnh lớn, giá trị đỉnh nhỏ, sai xót (mẫu) trong khoảng nào nhiều hơn.
      Thanks các bạn đã quan tâm !

      Xóa
  3. Bạn ơi sao cột lớp thứ nhất lại lùi vào so với trục tần suất vậy ạ?

    Trả lờiXóa
  4. Có phần mềm nào mà mình nhập số liệu (kiểu số liệu giống bảng 12) mà phần mềm tự vẽ biểu đồ luôn cho mình ko bạn ơi? Cảm ơn bạn.

    Trả lờiXóa
  5. Nhận xét này đã bị tác giả xóa.

    Trả lờiXóa
  6. Nếu mình nhận xét theo giới hạn kỹ thuật thì sẽ nhận xét như thế nào ạ?

    Trả lờiXóa
  7. Lam sao de dem du lieu v ban. Vs cai tan suat Tinh sao de ra a

    Trả lờiXóa
  8. 15 mẫu, mỗi mẫu cho 5 số đo thì lấy k ntn ạ?

    Trả lờiXóa
    Trả lời
    1. Nhận xét này đã bị tác giả xóa.

      Xóa
    2. Bạn lên xem lại là dùng phân tích biểu đồ phân bố tần số trong trường hợp của bạn có hợp lý ko.
      Vì bạn có 15 mẫu và mỗi mẫu lại chia ra 5 trường hợp. Có thể còn phải xét đến trọng số. Trong mỗi mẫu.
      Còn nếu bạn vẫn muốn dùng biểu đồ phân bố tần số thì trong trường hợp này bạn xét 15*5= 75 mẫu nhé.
      Thanks bạn!

      Xóa
  9. làm sao vẽ biểu đồ này bằng excel vậy ạ. em cảm ơn

    Trả lờiXóa
  10. phan XLOW =0.1-0.085=0.015
    ma 0.085 lấy ở đâu ra vậy bạn

    Trả lờiXóa
  11. ban co the chi ro hon ve cach ve bieu do khong?

    Trả lờiXóa
  12. cho mình hỏi cách tính tần số ạ mình chưa hiểu lắm sao ra tần số ạ

    Trả lờiXóa
  13. Nhận xét này đã bị tác giả xóa.

    Trả lờiXóa
  14. mình vẫn chưa hiểu lắm. tần số tính theo sông thức nào vạy ạ để ra những con số đó

    Trả lờiXóa
  15. Biểu đồ tần số vẽ excel rất dễ. Chỉ kết hợp 1-2 hàm từ raw data thôi

    Trả lờiXóa