4A_Ch4A_Mẫu đơn_Khoảng tin cậy_S.pptx trong kinh tế
tranvuthiennhan2006
8 views
83 slides
Aug 30, 2025
Slide 1 of 83
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
About This Presentation
Phân tích trong kinh tế và kinh doanh
Size: 2.64 MB
Language: none
Added: Aug 30, 2025
Slides: 83 pages
Slide Content
Suy luận thống kê dựa trên mẫu đơn : Khoảng tin cậy và kiểm định giả thuyết Chương 4A
Nội dung Phụ lục 1: Phân phối chuẩn Phân phối mẫu (Sampling Distribution) Khoảng tin cậy cho tham số của tổng thể Proper sample size for estimating a population parameter Kiểm định giả thuyết
Phụ lục 1 Phân phối chuẩn The Normal Distribution
Phân phối chuẩn Hình chuông , đối xứng Mean, median, mode bằng nhau . x f ( x ) Mean Median Mode *Độ lệch chuẩn càng lờn thì độ dài của hình chuông càng nhiều (Độ lệch chuẩn cho thấy độ rộng của phân phối) * Ý nghĩa kinh tế: Giá trị A và Giá trị
Hàm mật độ xác suất where µ = Mean of the normal random variable x = Standard deviation π = 3.1415 . . . e = 2.71828 . . . P ( x < a ) is obtained from a table of normal probabilities
Các tham số khác nhau ( & ) Probability = Pro(a<x<b); prob (x<b) - prob(x< a)
Xác suất c d x f ( x ) Xác suất là phần diện tích màu hồng !
Phân phối chuẩn tắc Là phân phối chuẩn với µ = 0 và = 1. Ký hiệu là z.
Bảng phân phối chuẩn tắc : P (0 < z < 1.96) z m = 0 s = 1 1.96 Z .04 .05 1.8 .4671 .4678 .4686 .4738 .4744 2.0 .4793 .4798 .4803 2.1 .4838 .4842 .4846 .06 1.9 .4750 Standardized Normal Probability Table (Portion) Probabilities .4750 Shaded area exaggerated NORM.S.DIST(1.96, TRUE) Tìm xác suất NORM.S.INV(0.9) Tìm z
Bảng phân phối chuẩn tắc : P (–1.26 z 1.26) z m = 0 s = 1 –1.26 Standardized Normal Distribution Shaded area exaggerated .3962 1.26 .3962 P (–1.26 ≤ z ≤ 1.26) = .3962 + .3962 = .7924
Bảng phân phối chuẩn tắc : P ( z > 1.26) z m = 0 s = 1 Standardized Normal Distribution 1.26 P ( z > 1.26) = .5000 – .3962 = .1038 .3962 .5000
Bảng phân phối chuẩn tắc : P (–2.78 z –2.00) s = 1 m = 0 –2.78 z –2.00 .4973 .4772 Standardized Normal Distribution Shaded area exaggerated P (–2.78 ≤ z ≤ –2.00) = .4973 – .4772 = .0201
Bảng phân phối chuẩn tắc : P ( z > –2.13) z m = 0 s = 1 –2.13 Standardized Normal Distribution Shaded area exaggerated P ( z > –2.13) = .4834 + .5000 = .9834 .5000 .4834
Phân phối chuẩn x f( x ) Normal distributions differ by mean & standard deviation. Each distribution would require its own table. That’s an infinite number of tables!
Chuyển phân phối chuẩn sang phân phối chuẩn tắc x là biến ngẫu nhiên theo phân phối chuẩn , với trung bình μ và độ lệch chuẩn . Biến ngẫu nhiên z theo phân phối chuẩn tắc , được định nghĩa :
Chuyển phân phối chuẩn sang phân phối chuẩn tắc Phân phối chuẩn x m s Sử dụng duy nhất 1 bảng ! m = 0 s = 1 z Phân phối chuẩn tắc
Tìm xác suất tương ứng với phân phối chuẩn 1. Vẽ phân phối chuẩn , xác định trung bình , xác định vùng diện tích tương ứng với xác suất cần tìm . 2. Chuyển các giá trị x giới hạn của vùng diện tích sang giá trị z tương ứng : 3. Tính vùng diện tích tương ứng trên phân phối chuẩn tắc dựa vào Bảng tính hoặc hàm trong excel.
Non-standard Normal μ = 5, σ = 10: P (5 < x < 6.2) z m = 0 s = 1 .12 Standardized Normal Distribution Shaded area exaggerated .0478 Normal Distribution x m = 5 s = 10 6.2
Non-standard Normal μ = 5, σ = 10: P (3.8 x 5) z m = 0 s = 1 -.12 Standardized Normal Distribution Normal Distribution x m = 5 s = 10 3.8 .0478 Shaded area exaggerated
Non-standard Normal μ = 5, σ = 10: P (2.9 x 7.1) s = 1 -.21 z .21 Standardized Normal Distribution 5 s = 10 2.9 7.1 x Normal Distribution .1664 .0832 .0832 Shaded area exaggerated
Non-standard Normal μ = 5, σ = 10: P ( x 8) x m = 5 s = 10 8 Normal Distribution z = 0 .30 Standardized Normal Distribution m s = 1 .3821 .5000 .1179 Shaded area exaggerated
Non-standard Normal μ = 5, σ = 10: P(7.1 X 8) m = 0 s = 1 .30 z .21 Standardized Normal Distribution m = 5 s = 10 8 7.1 x Normal Distribution .1179 .0347 .0832 Shaded area exaggerated
Ví dụ Bạn làm việc ở bộ phận kiểm soát chất lượng của GE. Tuổi thọ của bóng đèn theo phân phối chuẩn với = 2000 giờ và = 200 giờ . Hãy xác định xác suất mà tuổi thọ của bóng đèn : A. nằm trong khoảng từ 2000 đến 2400 giờ ? B. dưới 1470 giờ ?
Tìm z khi biết xác suất What is Z , given P ( z ) = .1217? Shaded area exaggerated z m = 0 s = 1 ? .1217 Standardized Normal Probability Table (Portion) Z .00 0.2 0.0 .0000 .0040 .0080 0.1 .0398 .0438 .0478 0.2 .0793 .0832 .0871 .1179 .1255 .01 0.3 .1217 .31
Tìm z khi biết xác suất Normal Distribution x m = 5 s = 10 ? .1217 Standardized Normal Distribution Shaded areas exaggerated z m = 0 s = 1 .31 .1217 8.1
Phân phối mẫu Sampling Distribution
Tham số & Chỉ số thống kê Tham số (parameter) là một đại lượng mô tả giá trị của tổng thể. Vì tham số được tính dựa trên tất cả các quan sát của tổng thể nên giá trị của tham số hầu như không xác định được . Chỉ số thống kê mẫu (sample statistic) là đại lượng mô tả giá trị của mẫu , được tính dựa trên các quan sát của mẫu .
Tham số & Chỉ số thống kê Chỉ số thống kê Tham số Phương sai s 2 2 Độ lệch chuẩn s Trung bình x Tỷ lệ p p ^
Phân phối mẫu The sampling distribution of a sample statistic calculated from a sample of n measurements is the probability distribution of the statistic. Thu thập ngẫu nhiên n quan sát cho mỗi mẫu từ tổng thể . Chỉ số thống kê của các mẫu này theo một phân phối được gọi là phân phối mẫu .
Phân phối mẫu của giá trị trung bình của các mẫu 1.0 1.5 2.0 2.5 1.5 2.0 2.5 3.0 2.0 2.5 3.0 3.5 2.5 3.0 3.5 4.0 2nd Observation 1 2 3 4 1 2 3 4 1st Obs Trung bình của 16 mẫu Sampling Distribution of the Sample Mean .0 .1 .2 .3 1.0 1.5 2.0 2.5 3.0 3.5 4.0 P( x ) x
Trung bình của tất cả các trung bình mẫu
So sánh Population Sampling Distribution .0 .1 .2 .3 1 2 3 4 .0 .1 .2 .3 1.0 1.5 2.0 2.5 3.0 3.5 4.0 P ( x ) x P (x) x
Phân phối mẫu của trung bình mẫu và Định lý giới hạn trung tâm
Đặc điểm của phân phối mẫu của x Trung bình của phân phối mẫu Độ lệch chuẩn của phân phối mẫu , và được gọi là standard error of the mean – sai số chuẩn của trung bình .
Định lý Nếu chọn ngẫu nhiên mẫu gồm n quan sát từ một tổng thể có phân phối chuẩn, thì phân phối mẫu có phân phối chuẩn .
Chọn mẫu từ tổng thể có phân phối chuẩn Xu hướng trung tâm Độ phân tán n =16 x = 2.5 m = 50 s = 10 x n = 4 x = 5 m x = 50 - x Sampling Distribution Population Distribution
Chuẩn hóa phân phối mẫu của x Standardized Normal Distribution m = 0 s = 1 z Sampling Distribution x m x s x
Định lý giới hạn trung tâm Một mẫu gồm n quan sát được chọn ngẫu nhiên từ một tổng thể ( có phân phối bất kỳ ) với trung bình μ và độ lệch chuẩn . Nếu n đủ lớn thì phân phối mẫu của sẽ gần giống phân phối chuẩn với trung bình và độ lệch chuẩn Cỡ mẫu càng lớn thì phân phối mẫu của càng gần với phân phối chuẩn .
Định lý giới hạn trung tâm x As sample size gets large enough ( n 30) ... sampling distribution becomes almost normal.
Định lý giới hạn trung tâm
Phân phối mẫu của tỷ lệ mẫu The Sampling Distribution of the Sample Proportion
Phân phối mẫu của 1. Trung bình của phân phối mẫu : Là ước lượng không chệch của p 2. Độ lệch chuẩn của phân phối mẫu 3. Với các mẫu lớn , phân phối mẫu gần với phân phối chuẩn , với sai số chuẩn (standard error).
Khoảng tin cậy của tham số
Tham số mục tiêu ( target parameter ) Là các tham số chưa biết của tổng thể cần được ước lượng . Tùy loại dữ liệu thì tham số mục tiêu khác nhau . Với dữ liệu định lượng , thường ước lượng trung bình hoặc phương sai . Với dữ liệu định tính với 2 kết quả ( thành công hoặc thất bại ), tỷ lệ thành công có thể là tham số cần được ước lượng .
Tham số mục tiêu Parameter Key Words of Phrase Type of Data µ Mean; average Quantitative p Proportion; percentage fraction; rate Qualitative
Ước lượng Nếu phân phối mẫu của một đại lượng thống kê mẫu có trung bình bằng với tham số tổng thể cần ước lượng , thì đại lượng thống kê đó được gọi là ước lượng không chệch ( unbiased estimate) của tham số tổng thể .
Ước lượng điểm L à một quy tắc hoặc công thức để tính ra một ước lượng duy nhất của tham số dựa trên dữ liệu mẫu .
Ước lượng điểm Cung cấp 1 giá trị dựa trên các quan sát của 1 mẫu . Không cho thấy giá trị này gần tham số cần ước lượng như thế nào . Ví dụ : Trung bình mẫu x = 3 là một ước lượng điểm của trung bình tổng thể
Ước lượng khoảng – Khoảng tin cậy Sử dụng mẫu để tính một khoảng giá trị ( khoảng tin cậy ) chứa tham số mục tiêu . Ví dụ : Trung bình của tổng thể nằm trong khoảng từ 50 đến 70 với mức độ tin cậy 95%.
Quy trình ước lượng Mean, , is unknown Tổng thể Sample Mẫu ngẫu nhiên Tôi tin tưởng 95% rằng nằm giữa các giá trị 40 & 60. Mean x = 50
Khoảng tin cậy Chỉ số thống kê mẫu ( Ước lượng điểm ) Khoảng tin cậy Cận dưới Cận trên Khoảng tin cậy cho thấy khoảng giá trị có thể của tham số .
Khoảng tin cậy Định lý giới hạn trung tâm : Phân phối mẫu của trung bình mẫu gần như phân phối chuẩn nếu mẫu đủ lớn . Khoảng tin cậy : Trên thực tế , có thể không biết được sigma. Độ lệch chuẩn của mẫu s là một ước lượng của sigma.
Khoảng tin cây If sample measurements yield a value of that falls between the two lines on either side of µ , then the interval will contain µ .
Khoảng tin cậy 95% Tin tưởng tới 95% rằng khoảng tin cậy chứa µ. 5% còn lại gọi là . /2 là diện tích của mỗi đuôi của phân phối . z /2 là giá trị critical value của z. Khoảng tin cậy (1 – ) là :
Mẫu lớn Khoảng tin cậy (1 – )% cho µ Nếu không biết và n lớn ( n ≥ 30), khoảng tin cậy : s là độ lệch chuẩn của mẫu . Nếu biết , khoảng tin cậy :
Điều kiện 1. Mẫu được chọn ngẫu nhiên từ tổng thể . 2. Cỡ mẫu n lớn ( n ≥ 30). Dựa vào Định lý giới hạn trung tâm thì điều kiện này đảm bảo phân phối mẫu gần chuẩn . Với cỡ mẫu n lớn s sẽ là ước lượng của .
Bài tập Số ghế trống trong mỗi chuyến bay là khoản doanh thu bị mất đi của một hãng hàng không . Một hãng hàng không muốn ước lượng số ghế trống trung bình trong năm ngoái . Dữ liệu về số ghế trống của 225 chuyến bay được trình bày trong file NOSHOW. Hãy ước lượng khoảng tin cậy 90% về số ghế trống trung bình của mỗi chuyến bay?
Ví dụ Một hãng dược muốn ước lượng mức tăng huyết áp của các bệnh nhân sau khi dùng thử thuốc mới . Mức độ tăng huyết áp của 6 bệnh nhân được trình bày trong bảng dưới . Hãy ước tính khoảng tin cậy 95% của mức tăng huyết áp trung bình của tất cả các bệnh nhân .
Mẫu nhỏ không biết Không sử dụng phân phối chuẩn tắc : Sử dụng chỉ số thống kê t: Trong đó độ lệch chuẩn của mẫu s được sử dụng làm thước đo độ lệch chuẩn tổng thể .
Student’s t -Statistic – chỉ số thống kê t Chỉ số thống kê t có phân phối rất giống phân phối của chỉ số z : hình chuông , đối xứng và có trung bình bằng 0. Sự khác biệt đó là chỉ số thống kê t biến động mạnh hơn .
Bậc tự do The actual amount of variability in the sampling distribution of t depends on the sample size n . A convenient way of expressing this dependence is to say that the t -statistic has ( n – 1) degrees of freedom ( df ) . Độ biến động trong phân phối của t phụ thuộc vào cỡ mẫu n , hay bậc tự do ( df ) (n-1).
z t Student’s t Distribution t (df = 5) Standard Normal t (df = 13) Bell-Shaped Symmetric ‘Fatter’ Tails
t - Table
t -value If we want the t -value with an area of .025 to its right and 4 df, we look in the table under the column t .025 for the entry in the row corresponding to 4 df. This entry is t .025 = 2.776. The corresponding standard normal z -score is z .025 = 1.96.
Mẫu nhỏ Khoảng tin cậy của µ where t a /2 is based on ( n – 1) degrees of freedom.
Điều kiện 1. Mẫu được chọn ngẫu nhiên từ tổng thể . 2. Tổng thể có phân phối tần suất gần chuẩn .
Ví dụ Bạn đang phân tích thời gian gia công ở các công đoạn của một chuyền sản xuất . Thời gian gia công ở mỗi công đoạn như sau ( phút ): 3.6, 4.2, 4.0, 3.5, 3.8, 3.1 . Hãy ước lượng khoảng tin cậy 90% thời gian gia công trung bình của tổng thể ?
Khoảng tin cậy cho tỷ lệ tổng thể - Mẫu lớn
Ví dụ Một công ty thực phẩm làm khảo sát thị trường bằng cách phỏng vấn ngẫu nhiên 1000 người tiêu dùng xem họ thích thương hiệu ngũ cốc nào . Có 313 người trả lời rằng họ thích thương hiệu ngũ cốc do công ty sản xuất . Hãy ước tính tỷ lệ khách hàng thích thương hiệu ngũ cốc của công ty trên toàn thị trường ?
Phân phối mẫu của Trung bình của phân phối mẫu là p, có nghĩa là ước lượng không chệch của p. Với mẫu lớn , phân phối mẫu của gần phân phối chuẩn . Mẫu lớn nếu : Độ lệch chuẩn của phân phối mẫu của
Khoảng tin cậy cho tỷ lệ tổng thể Với Điều kiện : 1. Mẫu được chọn ngẫu nhiên từ tổng thể . 2. Mẫu lớn :
Ví dụ Một mẫu ngẫu nhiên 400 sinh viên tốt nghiệp cho thấy 32 em sẽ đi học cao học . Hãy ước tinh khoảng tin cậy 95% cho p.
Bài tập Bạn là giảm đốc sản xuất của một tờ báo . Bạn muốn tìm tỷ lệ sản phẩm lỗi . Lấy mẫu ngẫu nhiên 200 tờ báo thì phát hiện 35 tờ có lỗi . Hãy ước tính khoảng tin cậy 90% tỷ lệ báo lỗi của tổng thể ?
Xác định cỡ mẫu
Cỡ mẫu và khoảng tin cậy
Sampling Error Để mô tả tính tinh cậy của khoảng tin cậy cho µ , cần chỉ ra sai số mẫu ( sampling error). Sai số mẫu (SE) là một nửa của khoảng tin cậy .
Xác định cỡ mẫu cho khoảng tin cậy 100(1 – ) % của µ Để ước lương µ với sai số mẫu (sampling error -SE) và khoảng tin cậy 100(1 – )%, cỡ mẫu cần phải có là : Tìm được n:
Ví dụ Hãy xác định cỡ mẫu để khoảng tin cậy 90% của trung bình nằm trong khoảng 5? Nghiên cứu thử nghiệm cho thấy độ lệch chuẩ là 45.
Xác định cỡ mẫu cho khoảng tin cậy 100(1 – ) % của p Cỡ mẫu cần thiết để ước lượng p với sai số mẫu SE của khoảng tin cậy 100(1 – )% được xác định bằng công thức sau : Giải phương trình trên thu được n: Lưu ý : luôn làm tròn n đến số nguyên gần nhất .