Anderson Sweeney Williams Slides by John Loucks St. Edward’s University THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ VÀ KINH DOANH
Chương 2, Phần A Thống kê mô tả : Trình bày bằng Bảng và đồ thị Tóm tắt dữ liệu định tính Dữ liệu định tính sử dụng nhãn hoặc tên để xác định các phân loại của yếu tố đó . Dữ liệu định lường là giá trị số chỉ ra bao nhiêu . Tóm tắt dữ liệu định lượng
Tóm tắt dữ liệu định tính Phân phối tần số Phân phối tần suất Phân phối tần suất phần trăm Biểu đồ thanh Biểu đồ tròn
Phân phối tần số là một bảng tóm tắt dữ liệu thể hiện tần số ( số lượng ) của các phần tử trong mỗi nhóm không chồng lấn . Mục đích là cung cấp cái nhìn sâu hơn về dữ liệu mà chúng ta không thể thấy được ngay trên dữ liệu ban đầu . Phân phối tần số
Khách lưu trú tại Marada Inn được yêu cầu đánh giá chất lượng phòng với các mức như : tuyệt vời , trên trung bình , trung bình , dưới trung bình , tệ . Bảng đánh giá của 20 du khách như sau : Dưới trung bình Trên trung bình Trên trung bình Trung bình Trên trung bình Trung bình Trên trung bình Trung bình Trên trung bình Dưới trung bình Tệ Tuyệt vời Trên trung bình Trung bình Trên trung bình Trên trung bình Dưới trung bình Tệ Trên trung bình Trung bỉnh Phân phối tần số Ví dụ Marada Inn
Phân phối tần số Tệ Dưới trung bình Trung bình Trên trung bình Tuyệt vời 2 3 5 9 1 Tổng 20 Đánh giá Tần số Ví dụ : Marada Inn
Phân phối tần suất của một nhóm bằng tỷ số hoặc tỷ lệ các phần tử thuộc về một nhóm . Phân phối tần suất là bảng tóm tắt dữ liệu thể hiện tần suất của mỗi nhóm . Phân phối tần suất
Phân phối tần suất phần trăm Tần suất phần trăm của một nhóm là tần suất nhân với 100 Phân phối tần suất phần trăm là bảng tóm tắt dữ liệu thể hiện tần suất phần trăm của mỗi nhóm .
Phân phối tần suất và tần suất phần trăm Tệ Dưới trung bình Trung bình Trên trung bình Tuyệt vời 0,10 0,15 0,25 0,45 0,05 Tổng 1,00 10 15 25 45 5 100 Tần suất Tần suất phần trăm Đánh giá 0,10(100) = 10 1/20 = 0,05 Ví dụ : Marada Inn
Biểu đồ Thanh Biểu đồ thanh là một kỹ thuật đồ họa để mô tả dữ liệu định tính . Trên 1 trục của biểu đồ ( thường là trục ngang ), chúng ta đặt các nhãn đại diện cho các nhóm . Tần số , tần suất , hoặc tần suất phần trăm được thể hiện trên trục còn lại của biểu đồ ( thường là trục đứng ). Dùng 1 thanh có chiều rộng cố định đại diện cho mỗi nhóm , mở rộng chiều dài thanh cho phù hợp . Các thanh được tách ra để nhấn mạnh thực tế rằng mỗi nhóm là riêng biệt .
Tệ Dưới trung bình Trung bình Trên Trung bình Tuyệt vời Tần số Đánh giá Biểu đồ thanh 1 2 3 4 5 6 7 8 9 10 Đánh giá chất lượng Marada Inn
Đồ thị Pareto Trong kiểm soát chất lượng , biểu đồ thanh được dùng để xác định nguyên nhân quan trọng của vấn đề . Khi các thanh được xếp theo thứ tự từ cao đến thấp từ trái sang phải ( với các nguyên nhân thường xảy ra nhất được xếp đầu tiên ) biểu đồ thanh này còn gọi là đồ thị Pareto. Đồ thị này được đặt tên theo tên người sáng lập ra nó , Vilfredo Pareto, một nhà kinh tế người Ý.
Biểu đồ tròn Biểu đồ tròn là kỹ thuật đồ họa để biểu diễn phân phối tần suất hoặc tần suất phần trăm cho dữ liệu định tính . Đầu tiên vẽ 1 vòng tròn ; sau đó dùng tần suất để chia vòng tròn thành các phần tương ứng với tần suất của mỗi nhóm . Vì 1 vòng tròn là 360 độ , 1 nhóm có tần suất là 0,25 sẽ có độ là 0,25(360) = 90 độ .
Dưới Trung bình 15% Trung bình 25% Trên Trung bình 45% Tệ 10% Tuyệt vời 5% Đánh giá chất lương Marada Inn Biểu đồ tròn
Hiểu biết đạt được từ biểu đồ tròn trước đó là : Ví dụ : Marada Inn Một nửa khách hàng được khảo sát đã đánh giá chất lượng Marada ở mức “ Trên trung bình ” hoặc “ tuyệt vời ” ( nhìn bên trái của hình tròn ). Điều này làm hài lòng nhà quản lý . Trong khi một khách hàng đánh giá “ tuyệt vời ”, thì có hai khách hàng đánh giá “ tệ ” ( nhìn ở phần trên của vòng tròn ). Điều này khiến nhà quản lý không hài lòng .
Tóm tắt dữ liệu định lượng Phân phối tần số Phân phối tần suất và tần suất phần trăm Đồ thị điểm Biểu đồ phân phối Histogram Phân phối tích lũy Đồ thị Ogive
Người quản lý của Hudson Auto muốn tìm hiểu sâu hơn về chi phí của các bộ phận được sử dụng để điều chỉnh động cơ ở cửa hàng . Cho kiểm tra 50 hóa đơn của khách hàng có nhu cầu điều chỉnh động cơ . Chi phí của các bộ phận , được làm tròn đến đồng đô la, được trình bày ở slide kế tiếp . Ví dụ : Hudson Auto Repair Phân phối tần số
Mẫu chi phí các bộ phận ( đô la) của 50 nhu cầu điều chỉnh động cơ Phân phối tần số Ví dụ : Hudson Auto Repair
Phân phối tần số 2. Xác định độ rộng của mỗi nhóm . 3. Xác định các giới hạn nhóm . 1. Xác định số lượng các nhóm riêng biệt . Ba bước cần thiết để xác định các nhóm cho một phân phối tần số với dữ liệu định lượng :
Phân phối tần số Hướng dẫn xác định số lượng nhóm Nên dùng khoảng 5 đến 20 nhóm . Tập dữ liệu với sô lượng lớn các phần tử thì đòi hỏi nhiều nhóm . Tập dữ liệu nhỏ thì cần ít nhóm hơn . Mục đích là số nhóm vừa đủ để thể hiện được sự thay đổi của dữ liệu , nhưng không nên có quá nhiều nhóm mà một nhóm chỉ chứa một vài phần tử .
Phân phối tần số Hướng dẫn xác định độ rộng của mỗi nhóm Các nhóm có độ rộng bằng nhau giá trị lớn nhất . Độ rộng nhóm xấp xỉ Các nhóm có cùng độ rộng giúp giảm thiểu những cái nhìn không phù hợp về dữ liệu .
Lưu ý về số lượng nhóm và độ rộng nhóm Trong thực hành , số lượng nhóm và độ rộng nhóm thích hợp được xác định bằng cách thử và sai . Một khi số lượng nhóm được chọn , sẽ tính toán được độ rộng nhóm tương ứng . Quá trình này có thể lặp lại với số lượng nhóm khác nhau . Phân phối tần số Cuối cùng , nhà phân tích dùng phán đoán để xác định sự kết hợp số lượng nhóm và độ rộng nhóm để có một phân phối tần số tốt nhất cho tóm tắt dữ liệu
Frequency Distribution Hướng dẫn xác định giới hạn nhóm Giới hạn nhóm phải được chọn sao cho mỗi giá trị quan sát chỉ thuộc về một và chỉ một nhóm . Giới hạn dưới xác định giá trị nhỏ nhất được gán cho nhóm . Giới hạn trên xác định giá trị lớn nhất được gán cho nhóm Các giá trị thích hợp cho giới hạn nhóm phụ thuộc vào độ chính xác của dữ liệu . Nhóm mở chỉ được dùng cho nhóm đầu tiên hoặc nhóm cuối cùng .
Phân phối tần số Nếu chọn 6 nhóm : 50-59 60-69 70-79 80-89 90-99 100-109 2 13 16 7 7 5 Tổng 50 Chi phí ( đô la) Tần số Độ rông nhóm xấp xỉ = (109 - 52)/6 = 9,5 10 Ví dụ : Hudson Auto Repair
Phân phối tần suất và tần suất phần trăm 50-59 60-69 70-79 80-89 90-99 100-109 Chi phí ( độ la) 0,04 0,26 0,32 0,14 0,14 0,10 Tổng 1,00 Tần suất 4 26 32 14 14 10 100 Tần suất phần trăm 2/50 0,04(100) Ví dụ : Hudson Auto Repair Tần suất phần trăm là tần suất nhân với 100
Chỉ 4% có chi phí các bộ phận trong khoảng 50-59 đô la Phần trăm lớn nhất (32% hoặc gần một phần ba ) có chi phí các bộ phận thuộc khoảng 70-79 đô la. 30% có chi phí các bộ phận dưới 70 đô la. 10% có chi phí các bộ phận từ 100 đô la trở lên . Thông tin từ % phân phối tần suất Phân phối tần suất và tần suất phần trăm Ví dụ : Hudson Auto Repair
Đồ thị điểm Một trong những đồ thị tóm tắt đơn giản nhất cho dữ liệu là đổ thị điểm . Trục ngang thể hiện phạm vi biến thiên của dữ liệu . Mỗi giá trị dữ liệu được đại diện bởi một điểm trên trục .
Đồ thị điểm 50 60 70 80 90 100 110 Chi phí ( đô la) Chi phí điều chỉnh động cơ Ví dụ : Hudson Auto Repair
Biểu đồ phân phối Histogram Một loại biểu đồ phổ biến dùng cho dữ liệu định lượng là biểu đồ phân phối histogram . Biến quan tâm được đặt ở trục ngang . Một hình chữ nhật được vẽ trên mỗi nhóm với chiều cao tương ứng tần số , tần suất , hoặc tần suất phần trăm Không giống như biểu đồ thanh , biểu đồ phân phối histogram không có sự tách biệt giữa các hình chữ nhật của các nhóm liền kề .
Biểu đồ phân phối Histogram 2 4 6 8 10 12 14 16 18 Chi phí ( đô la) Tần số 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100-110 Chi phí điều chỉnh động cơ Ví dụ : Hudson Auto Repair
Đối xứng Biểu đồ phân phối thể hiện độ bất đối xứng Tần suất 0,05 0,10 0,15 0,20 0,25 0,30 0,35 Đuôi trái phản chiếu hình dạng đuôi phải Ví dụ : Chiều cao và cân nặng của người dân
Biểu đồ phân phối thể hiện độ bất đối xứng Hơi lệch trái Tần suất 0,05 0,10 0,15 0,20 0,25 0,30 0,35 Đuôi bên trái kéo dài hơn Ví dụ : điểm thi
Hơi lệch phải Biểu đồ phân phối thể hiện độ bất đối xứng Tần suất 0,05 0,10 0,15 0,20 0,25 0,30 0,35 Đuôi bên phải kéo dài hơn Ví dụ : giá nhà
Biểu đồ phân phối thể hiện độ bất đối xứng Lệch phải nhiều Tần suất 0,05 0,10 0,15 0,20 0,25 0,30 0,35 Đuôi bên phải kéo dài nhiều Ví dụ : Lương giám đốc / nhà điều hành
Phân phối tần số tích lũy - thể hiện số lượng dữ liệu có giá trị nhỏ hơn hoặc bằng với giới hạn trên của mỗi nhóm . Phân phối tần suất tích lũy – thể hiện tỷ lệ dữ liệu có giá trị nhỏ hơn hoặc bằng giới hạn trên của mỗi nhóm . Phân phối tích lũy Phân phối tần suất phần trăm tích lũy – thể hiện phần trăm của dữ liệu có giá trị nhỏ hơn hoặc bằng giới hạn trên của mỗi nhóm .
Phân phối tích lũy Nhóm cuối cùng của một phân phối tần số tích lũy luôn bằng tổng số quan sát . Nhóm cuối cùng của một phân phối tần suất tích lũy luôn bằng 1,0. Nhóm cuối cùng của một phân phối tần suất phần trăm tích lũy luôn bằng 100.
Phân phối tích lũy Hudson Auto Repair < 59 < 69 < 79 < 89 < 99 < 109 Chi phí ( đô la) Tần số tích lũy Tần suất Tích lũy Tần suất phần trăm tích lũy 2 15 31 38 45 50 0,04 0,30 0,62 0,76 0,90 1,00 4 30 62 76 90 100 2 + 13 15/50 0,30(100)
Đồ thị Ogive Ogive là một đồ thị phân phối tích lũy . Giá trị dữ liệu đặt ở trục ngang . Trục đứng biểu diễn : Tần số tích lũy , hoặc Tần suất tích lũy , hoặc Tần suất phần trăm tích lũy Tần số ( hoặc một trong các chỉ tiêu trên ) của mỗi nhóm là một điểm . Các điểm đuộc nối lại với nhau bằng một đường thẳng .
Bởi vì các giới hạn nhóm của dữ liệu chi phí điều chỉnh động cơ là 50-59, 60-69,…, có một khoảng cách đều nhau là 1 đơn vị từ 59 đến 60, 69 đến 70,….( tương tự ). Đồ thị Ogive Khoảng trống này sẽ vẽ những điểm nằm giữa giới hạn nhóm . Do đó , 59.5 đại diện cho nhóm 50-59, 69.5 đại diện cho nhóm 60-69,... Hudson Auto Repair
Chi phí ( đô la) 20 40 60 80 100 Tần suất phần trăm tích lũy 50 60 70 80 90 100 110 (89,5; 76) Đồ thị Ogive với tần suất phần trăm tích lũy Chi phí điều chỉnh động cơ Example: Hudson Auto Repair