Chuong 4 - Lý thuyết mẫu và lý thuyết ước lượng new.pdf

truonggiang1501 0 views 75 slides Sep 28, 2025
Slide 1
Slide 1 of 75
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75

About This Presentation

tai lieu tham khao


Slide Content

228

PHẦN II: THỐNG KÊ

Thống kê toán là bộ môn toán học nghiên cứu quy luật của các
hiện tượng ngẫu nhiên có tính chất số lớn trên cơ sở thu nhập và
xử lý các số liệu thống kê (các kết quả quan sát).
Nội dung chủ yếu của thống kê toán là xây dựng các phương
pháp lý thuyết thu nhập và xử lý các số liệu thống kê, nhằm rút
ra các kết luận khoa học từ thực tiễn, dựa trên những thành tựu
của lý thuyết xác suất.
Thống kê ứng dụng bao gồm thống kê mô tả và thống kê suy
diễn. Việc thu thập, sắp xếp và xử lý dữ liệu, trình bày tóm tắt
các số liệu của tổng thể hay của một mẫu được gọi là thống kê
mô tả. Còn việc sử dụng các thông tin của dữ liệu để tiến hành
các suy đoán, mô hình hóa, giải thích các biến động … về tổng
thể gọi là thống kê suy diễn.

229
Thống kê được ứng dụng vào mọi lĩnh vực khoa học và xã hội. Một số
ngành đã phát triển thống kê ứng dụng chuyên sâu trong ngành như
thống kê trong xã hội học, trong y khoa, trong giáo dục học, trong tâm
lý học, trong kỹ thuật, trong sinh học, trong phân tích hóa học, trong
thể thao, trong hệ thống thông tin địa lý, trong xử lý hình ảnh… Thống
kê được sử dụng để nhận thức tình hình và hỗ trợ ra quyết định trong
các lĩnh vực kinh doanh và quản lý nhà nước.
Ở một khía cạnh khác, người ta cho rằng các kiến thức thống kê có thể
bị dùng sai do sự diễn giải dữ liệu có lợi cho chủ đích người trình bày;
hoặc có sai lệch mà người làm nghiên cứu không nhận ra. “Thống kê
giống như những cái bánh nhân thịt, nó ngon khi bạn biết người đã
làm ra chúng, và khi bạn biết rõ thành phần của chúng”- Lawrence
Lowell, chủ tịch trường Harvard, 1909 – trích từ tài liệu số (7). Mặt khác,
các kết quả thống kê được thông tin qua các phương tiện truyền
thông hay bị đơn giản đi quá mức về những chi tiết rất quan trọng
như phạm vi nghiên cứu… dẫn đến công chúng có thể hiểu sai.

230
Chương 4: LÝ THUYẾT MẪU & LÝ THUYẾT ƯỚC LƯỢNG
4a. Sơ lược về LÝ THUYẾT MẪU - slide 231
4b. LÝ THUYẾT ƯỚC LƯỢNG - slide 254
Bảng 2: Phân phối XS của hàm trung bình mẫu và tỷ lệ mẫu (slide 261).
Bảng 3: Công thức xác định các khoảng ước lượng cho  và p;+ hướng dẫn (các slide 267-268)
Bảng 4: Phân phối XS của hàm hiệu 2 trung bình mẫu và hiệu 2 tỷ lệ mẫu (các slide 294-295).
Bảng 5: Công thức xác định các khoảng ước lượng cho 
1- 
2 và p
1-p
2 ( các slide 296-297).
Bảng 2 và Bảng 4 dùng cho cả chương 4 và chương 5.
Chương 5: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
(KIỂM ĐỊNH 1 MẪU - KIỂM ĐỊNH 2 MẪU )
Chương 6: PHÂN TÍCH PHƯƠNG SAI
(PHÂN TÍCH PHƯƠNG SAI 1 YẾU TỐ )
Chương 7: LÝ THUYẾT HỒI QUY ĐƠN

4.1. Một số khái niệm:
•Tổng thể thống kê (Population) là tập hợp các phần tử thuộc
đối tượng nghiên cứu, cần được quan sát, thu thập và phân
tích theo một hoặc một số đặc trưng nào đó. Các phần tử tạo
thành tổng thể thống kê được gọi là đơn vị tổng thể.
•Mẫu (sample) là một số đơn vị được chọn ra từ tổng thể theo
một phương pháp lấy mẫu nào đó. Các đặc trưng mẫu được
sử dụng để suy rộng ra các đặc trưng của tổng thể nói chung.
•Đặc điểm thống kê (dấu hiệu nghiên cứu) là các tính chất
quan trọng liên quan trực tiếp đến nội dung nghiên cứu và
khảo sát cần thu thập dữ liệu trên các đơn vị tổng thể; Người
ta chia làm 2 loại: đặc điểm thuộc tính và đặc điểm số lượng.
231
Chương 4a: LÝ THUYẾT MẪU
Chương 4: L{ thuyết mẫu và L{ thuyết ước lượng

232
•Phương pháp nghiên cứu toàn bộ tổng thể phù hợp khi kích
thước tổng thể nhỏ; khi có được sự kết hợp với các khảo sát
quy mô lớn; khi có sự hỗ trợ của công nghệ trong việc thu thập
và xử lý số liệu lớn… Trong những trường hợp phổ biến hơn,
người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc
biệt là phương pháp chọn mẫu.
•Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng các
phương pháp xác suất thì thu được kết luận một cách nhanh
chóng, đỡ tốn kém mà vẫn đảm bảo độ chính xác cần thiết.
•Có 2 phương pháp để lấy một mẫu có n phần tử : lấy có hoàn
lại và lấy không hoàn lại. Nếu kích thước mẫu rất bé so với kích
thước tổng thể thì hai phương pháp này được coi là cho kết
quả như nhau.
•Về mặt lý thuyết, ta giả định rằng các phần tử được lấy vào mẫu
theo phương thức có hoàn lại và mỗi phần tử của tổng thể đều
được lấy vào mẫu với khả năng như nhau.

Chương 4: L{ thuyết mẫu và LT ước lượng

•Việc sử dụng bất kz phương pháp thống kê nào cũng chỉ đúng đắn khi
tổng thể nghiên cứu thỏa mãn những giả thiết toán học cần thiết của
phương pháp. Việc sử dụng sai dữ liệu thống kê (đôi khi xảy ra với cả nhà
chuyên môn), có thể tạo ra những sai lầm nghiêm trọng trong việc mô tả
và diễn giải. Chúng có thể ảnh hưởng đến các phác đồ điều trị y khoa; đến
việc đề ra các chính sách xã hội, các chiến lược kinh doanh …
Bằng việc chọn (hoặc bác bỏ, hay thay đổi) một giá trị nào đó, hay việc bỏ
đi các giá trị quan sát quá lớn hoặc quá nhỏ cũng là một cách làm thay đổi
kết quả; và đôi khi những kết quả thú vị khi nghiên cứu với mẫu nhỏ lại
không còn đúng với mẫu lớn.
•Dữ liệu sơ cấp là dữ liệu được thu thập trực tiếp từ đối tượng nghiên cứu
theo yêu cầu của người làm nghiên cứu.
•Dữ liệu thứ cấp là dữ liệu từ những nguồn có sẵn, thường đã qua tổng
hợp, xử lý; Sử dụng dữ liệu thứ cấp giúp người nghiên cứu ít tốn kém thời
gian, công sức; chi phí so với việc thu thập dữ liệu sơ cấp; cần lưu ý dữ liệu
này đôi khi không đáp ứng đủ các yêu cầu chi tiết hơn của nghiên cứu.
233 Chương 4: L{ thuyết mẫu và LT ước lượng

234
Khái quát quá trình nghiên cứu thống kê
Xác định vấn đề nghiên cứu, mục tiêu, nội dung,
đối tượng nghiên cứu.

Xây dựng hệ thống các khái niệm, các chỉ tiêu thống kê.

Thu thập các dữ liệu thống kê.

Xử lý số liệu:
- Kiểm tra, chỉnh lý và sắp xếp số liệu.
- Phân tích thống kê sơ bộ.
- Phân tích thống kê thích hợp.

Phân tích và giải thích kết quả.

Báo cáo và truyền đạt kết quả nghiên cứu

Chương 4: L{ thuyết mẫu và LT ước lượng

Có 2 nhóm kỹ thuật lấy mẫu là kỹ thuật lấy mẫu xác suất
(probability sampling ) , trên nguyên tắc mọi phần tử trong
tổng thể đều có cơ hội được lấy vào mẫu như nhau) và lấy
mẫu phi xác suất (non- probability sampling ) .
4.2 CÁC KỸ THUẬT LẤY MẪU XÁC SUẤT:
4.2.1 Lấy mẫu ngẫu nhiên đơn giản (simple random sampling):
Cách tiến hành:
- Lập danh sách tổng thể theo số thứ tự, gọi là khung lấy mẫu.
- Xác định số phần tử n cần lấy vào mẫu (sample size).
- Chọn 1 mẫu gồm các đối tượng có số thứ tự được lựa chọn
ra 1 cách ngẫu nhiên bằng cách bốc thăm, lấy từ 1 bảng số
ngẫu nhiên; bằng MTBT hay 1 phần mềm thống kê nào đó.
-Ưu điểm: Tính đại diện cao.
-Hạn chế: Mẫu phải không có kích thước quá lớn; Người
nghiên cứu phải lập được danh sách tổng thể cần khảo sát.
235 Chương 4: L{ thuyết mẫu và LT ước lượng

4.2.2 Lấy mẫu hệ thống ( systematic sampling):
Cách tiến hành:
-Lập danh sách N phần tử của tổng thể, có mã là số thứ tự.
- Xác định số phần tử n cần lấy vào mẫu (sample size).
-Xác định số nguyên k gọi là khoảng cách, k lấy giá trị làm
tròn của N/n. Chọn phần tử đầu tiên vào mẫu 1 cách ngẫu
nhiên (có số thứ tự trong khoảng 1 đến k hay 1 đến N). Các
phần tử tiếp theo là các phần tử có STT = STT phần tử đầu tiên
+ k/2k/3k/…
Có thể quay vòng lại để tiếp tục nếu lấy mẫu chưa đủ n phần
tử; khi đó coi phần tử số 1 có STT là N+1,…
-Ưu điểm: Tiết kiệm thời gian khi cần mẫu có kích thước lớn.
-Hạn chế: Người nghiên cứu phải lập được danh sách tổng
thể cần khảo sát. Thứ tự trong danh sách tổng thể chỉ để mã
hóa, không được sắp xếp theo các đặc điểm khảo sát.
236 Chương 4: L{ thuyết mẫu và LT ước lượng

4.2.3 Lấy mẫu phân tầng ( stratified sampling):
Cách tiến hành:
-Chia tổng thể thành nhiều tầng khác nhau dựa vào các tính
chất liên quan đến đặc điểm cần khảo sát. Trên mỗi tầng thực
hiện lấy mẫu ngẫu nhiên đơn giản với số lượng phần tử cần lấy
vào mẫu là n
i được phân bổ theo tỉ lệ các phần tử ở mỗi tầng.
-Trong thực tế, với mẫu được chọn, người ta có thể kết hợp
khảo sát thêm các đặc điểm riêng lẻ đối với những phần tử trong
cùng 1 tầng. Khi đó nếu nhận thấy 1 vài giá trị m
i quá nhỏ làm
các khảo sát riêng lẻ đó không đủ độ tin cậy thì chúng ta cần lấy
mẫu không cân đối (disproportionately) và phải quan tâm đến
việc hiệu chỉnh kết quả theo trọng số. ( xem thêm tài liệu).
-Ưu điểm: Kỹ thuật này làm tăng khả năng đại diện của mẫu
theo đặc điểm cần khảo sát. Ở các nghiên cứu có quy mô lớn,
người ta thường kết hợp với cách lấy mẫu cả cụm.
237 Chương 4: L{ thuyết mẫu và LT ước lượng

4.2.4 Lấy mẫu cả cụm( cluster sampling) và lấy mẫu nhiều giai
đoạn (multi- stage sampling):
Cách tiến hành:
-Chia tổng thể thành nhiều cụm theo các tính chất nào đó ít
liên quan đến đặc tính cần khảo sát, chọn ra m cụm ngẫu nhiên.
Khảo sát hết các phần tử trong các cụm đã lấy ra. Theo cách này
số phần tử lấy vào mẫu có thể nhiều hơn số cần thiết n và các
phần tử trong cùng cụm có thể có khuynh hướng giống nhau.
-Để khắc phục, ta chọn m cụm gọi là mẫu bậc 1 nhưng không
khảo sát hết mà trong từng cụm bậc 1 lại chọn ngẫu nhiên k
i cụm
nhỏ gọi là mẫu bậc 2;…làm như vậy cho đến khi đủ số lượng cần.
Khảo sát tất cả các phần tử đã được chọn ở bậc cuối cùng.
-Ưu điểm: Kỹ thuật này xử lý tốt các khó khăn gặp phải khi
tổng thể có phân bố rộng về mặt địa lý ( thời gian, tiền bạc, nhân
lực, bảo quản dữ liệu…), hay khi lập 1 danh sách tổng thể đầy đủ.
238 Chương 4: L{ thuyết mẫu và LT ước lượng

239
4.3 MỘT SỐ KỸ THUẬT LẤY MẪU PHI XÁC SUẤT:
4.3.1 Lấy mẫu thuận tiện (convenient sampling):
Người lấy mẫu lấy thông tin cần khảo sát ở những nơi mà người đó
nghĩ là thuận tiện.
4.3.1 Lấy mẫu định mức (quota sampling):
Người lấy mẫu chia tổng thể thành các tổng thể con ( tương tự như
phân tầng trong lấy mẫu phi xác suất) rồi dựa vào kinh nghiệm tự
định mức số phần từ cần lấy vào mẫu theo 1 tỷ lệ nào đó.
4.3.1 Lấy mẫu phán đoán (judgement sampling):
Người lấy mẫu dựa vào năng lực và kinh nghiệm của mình để tự
phán đoán cần khảo sát trong phạm vi nào, những phần tử nào cần
chọn vào mẫu.
Mẫu phi xác suất không đại diện cho toàn bộ tổng thể nhưng được
chấp nhận trong nghiên cứu khám phá; trong việc ước lượng sơ bộ do
việc nghiên cứu bị hạn chế thời gian, kinh phí, hay đôi khi chỉ để hoàn
thiện một bộ câu hỏi khảo sát.


Chương 4: L{ thuyết mẫu và LT ước lượng

240
4.4 MỘT SỐ VẤN ĐỀ LIÊN QUAN:
4.4.1 Cỡ mẫu được tính như thế nào?
Mặc dù có thể đưa công thức cho 1 số trường hợp nhưng đáp
án duy nhất là không có. Về nguyên tắc, mẫu càng lớn thì càng
chính xác vì sai số lấy mẫu có thể giảm khi tăng kích thước
mẫu. Tuy nhiên thời gian và nguồn lực của nhà nghiên cứu có
hạn nên người ta phải cân nhắc chúng với yêu cầu về độ chính
xác, độ tin cậy của khảo sát, loại phân tích sẽ dùng để xử lý dữ
liệu.
4.4.2 Sai lệch hệ thống (Bias) trong chọn mẫu:
-Sai lệch ( hay thiên lệch) trong lấy mẫu thể hiện việc lấy mẫu
có xu hướng không đại diện cho tổng thể, sai lệch này nằm
trong cách thức lấy mẫu và cách thức thu thập thông tin từ
mẫu. Có các loại sai lệch thường gặp sau:

Chương 4: L{ thuyết mẫu và LT ước lượng

241
-Sai lệch lựa chọn mẫu ( Selection Bias): sai lệch này xuất
hiện khi cách thức lấy mẫu đã làm loại trừ hay hạn chế cơ hội
được lấy vào mẫu của bộ phận trong tổng thể.
-Sai lệch đo lường hay sai lệch phản hồi (Measurement or
Response Bias): sai lệch này làm cho thông tin chúng ta nhận
được từ mẫu đã chọn không đúng với giá trị thực của nó. Sai
lệch này xảy ra có thể do cách đo lường không chuẩn (cách
thiết kế bảng câu hỏi, cách đặt vấn đề, cách dùng từ ngữ, cách
thức tiếp cận mẫu,…)
-Sai lệch do không phản hồi (Non-Response Bias): do không
có thông tin phản hồi từ 1 bộ phận trong mẫu đã thiết kế nên
có thể ảnh hưởng đến tính đại diện của mẫu. Các cuộc điều
tra qua email thường ít tốn kém nhưng tỷ lệ phản hồi thấp;
các cuộc phỏng vấn cá nhân có tỷ lệ phản hồi cao hơn.







Chương 4: L{ thuyết mẫu và LT ước lượng

242
4.5 THIẾT KẾ THÍ NGHIỆM
- Xem giáo trình XSTK và PTSL (tg: Nguyễn Tiến Dũng, Ng. Đình Huy).
- Xem file tài liệu tham khảo kèm theo (tg: Nguyễn Văn Tuấn).
4.6 MÔ TẢ DỮ LIỆU BẰNG BIỂU ĐỒ VÀ ĐỒ THỊ (Ch3-sách TKƯD)
- Dữ liệu định tính ( Biểu đồ cột; biểu đồ Pie).
- Dữ liệu định lượng: Biểu đồ cành lá; biểu đồ phân bố tần số hoặc
tần suất (Histograms); biểu đồ mật độ tần suất trong cả trường hợp
các khoảng chia bằng nhau và các khoảng chia không bằng nhau.
4.7 TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ (Ch4-sách TKƯD)
- TrB nhân; TrB điều hòa. Ý nghĩa của hệ số biến thiên CV.
- Hình dáng phân phối của dữ liệu, liên hệ với biểu đồ hộp và râu.
- Quy tắc phân phối dữ liệu thực nghiệm.
- Chuẩn hóa dữ liệu.
4.8 Tìm hiểu 1 số phần mềm máy tính có chức năng thống kê được
dùng để mô tả dữ liệu mẫu: EXCEL; SPSS; STATA; R, MFIT…
Chương 4: L{ thuyết mẫu và LT ước lượng

243
4.9 CÁC ĐẶC TRƯNG CỦA TỔNG THỂ:
•Kích thước tổng thể là số lượng các phần tử của tổng thể.
Trong nhiều trường hợp, ta không biết được số chính xác.
•Khi khảo sát tổng thể theo một dấu hiệu nghiên cứu nào đó, người
ta mô hình hóa nó bởi một biến ngẫu nhiên X, gọi là biến ngẫu
nhiên gốc. Các đặc trưng thường gặp khi dấu hiệu nc là định lượng:
- Trung bình tt (Kz vọng ) E(X) Kí hiệu : 
- Phương sai tổng thể V(X)  
2

- Độ lệch chuẩn tổng thể  
•Trường hợp dấu hiệu nghiên cứu mang tính chất định tính thì ta coi
X có phân phối Bernoulli ( hay là pp không – một). Tỉ lệ tổng thể là
xác suất lấy được phần tử mang dấu hiệu nghiên cứu từ tổng thể.
- Tỉ lệ tổng thể: Kí hiệu : p V(X)
Chương 4: L{ thuyết mẫu và LT ước lượng

244
4.10 CÁC ĐẶC TRƯNG CỦA MẪU:
• Mẫu ngẫu nhiên 1 chiều kích thước n là tập hợp của n biến
ngẫu nhiên độc lập X
1 , X
2 , .., X
n được thành lập từ biến ngẫu
nhiên X của tổng thể nghiên cứu và có cùng quy luật phân
phối xác suất với X. E(X
i) = E(X) = µ; V(X
i ) = V(X) = 
2
, i
•Kí hiệu của mẫu tổng quát kích thước n là: W = (X
1 , X
2 , .., X
n)
Việc thực hiện một phép thử đối với mẫu ngẫu nhiên W chính
là thực hiện một phép thử đối với mỗi thành phần X
i. Ta gọi
kết quả w
n = ( x
1, x
2 , .., x
n ) tạo thành là mẫu cụ thể.
•Bảng phân phối tần số thực nghiệm là một biểu diễn khác của
mẫu cụ thể:
x
i x
1 x
2 …. x
k

với

n
i n
1 n
2 …. n
k
k
i
i=1
n=n
Chương 4: L{ thuyết mẫu và LT ước lượng

245
CÁC ĐẶC TRƯNG CỦA MẪU:
1. Trung bình mẫu (sample mean):


2. Phương sai mẫu (Sample variance):


Độ lệch mẫu: (SD- Standard Deviation): s
3. . Phương sai theo công thức XS:
Chương 4: L{ thuyết mẫu và LT ước lượng

246
3. Tỉ lệ mẫu (mẫu định tính):

4. Yếu vị ( Mode)
5. Các sai số chuẩn (Standard error): xem các bảng phía sau.
6. Hệ số biến thiên ( Coefficient of variation - CV) (tk):
Hệ số biến thiên đo lường mức độ biến động tương đối của mẫu dữ liệu,
được dùng khi người ta muốn so sánh mức độ biến động của các mẫu
không cùng đơn vị đo.
7. Trung vị (Median – Md): (với mẫu không được phân tổ dữ liệu)
Giả sử mẫu có kích thước n và các phần tử được sắp xếp tăng
dần theo giá trị được khảo sát: x
1  x
2  ….  x
n-1  x
n .
Nếu n = 2k+1 thì trung vị mẫu là giá trị x
k+1 .
Nếu n = 2k thì trung vị mẫu là giá trị ( x
k +x
k+1 ): 2.
Chương 4: L{ thuyết mẫu và LT ước lượng

247
8. Tứ phân vị ( Quartiles)
Giá trị trung vị chia mẫu dữ liệu đã sắp thứ tự thành 2 tập có
số phần tử bằng nhau. Trung vị của tập dữ liệu nhỏ hơn là Q
1
(gọi là tứ phân vị dưới) và trung vị của tập dữ liệu lớn hơn là
Q
3 ( gọi là tứ phân vị trên). Q
2 được lấy bằng giá trị trung vị.
Độ trải giữa, hay là khoảng tứ phân vị IQR  R
Q

= Q
3 - Q
1 .
9. Điểm Outlier: còn gọi là điểm dị biệt, điểm ngoại lệ, điểm
ngoại lai…. Đó là các phần tử của mẫu có giá trị nằm ngoài
khoảng ( Q1 – 1,5  IQR; Q3 + 1,5  IQR) .
10. Vẽ biểu đồ hộp và râu:
Xét mẫu có kích thước n = 9 đã được sắp theo thứ tự tăng dần:
1 3 4 4 5 5 6 8 12

Q
1 = 3,5
Q
2 Q
3 = 7



Chương 4: L{ thuyết mẫu và LT ước lượng

248
Khoảng trải giữa IQR = Q
3 – Q
1 = 7 – 3,5 = 2,5
Q
1 – 1,5IQR = - 0,25 Q
3 + 1,5IQR = 10,75




Có 1 giá trị outlier là 12
Điều chỉnh lại 2 râu của hình hộp đến 2 giá trị nhỏ nhất và lớn
nhất của dữ liệu, không tính các giá trị outlier .

Chương 4: L{ thuyết mẫu và LT ước lượng

249
Ví dụ 1: Phòng CTSV khảo sát về chi phí trong 1 học kz của SV
K22 dành cho các hoạt động ngoại khóa. Có 50 sinh viên được
lựa chọn ngẫu nhiên để trả lời bảng khảo sát.
Gọi X là chi phí của mỗi sv K20 cho hoạt động ngoại khóa.
Giả sử những SV có chi phí cho HĐNK trên 2 triệu đ/ 1 hk được
gọi là có chi phí HĐNK cao.
Chương 4: L{ thuyết mẫu và LT ước lượng

Chương 4: L{ thuyết mẫu và LT ước lượng 250
HD Sử dụng MTBT tìm 1 số đặc trưng của BNN rời rạc:

251
Liên hệ giữa các kết quả trung gian :


Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 2: Người ta lấy 16 mẫu nước trên 1 dòng sông để
phân tích hàm lượng BOD ( đơn vị mg/l), kết quả thu được:
125 205 134 137 168 174 158 172
98 113 174 185 197 163 168 141
Hãy tìm: a) Trung bình mẫu; mode; Md; độ lệch mẫu;CV mẫu.
b) Phương sai mẫu ; S
xx.
c) Tứ phân vị và khoảng tứ phân vị.



252 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 3:
Khảo sát thời gian gia công của 1 số chi tiết máy được chọn
ngẫu nhiên, người ta ghi nhận số liệu:


a) Tính các đặc trưng mẫu sau:
b) Tìm tỷ lệ các chi tiết được gia công dưới 19 phút.
;;;.
x
nxs Thời gian gia công (phút) 15-17 17-19 19-21 21-23 23-25 25-28
Số chi tiết máy tương ứng 11 32 54 32 23 22

253 Chương 4: L{ thuyết mẫu và LT ước lượng

Xét trường hợp một dấu hiệu nghiên cứu trong tổng thể, được
xem như một biến ngẫu nhiên X, có một tham số  nào đó mà ta
chưa biết. Yêu cầu đặt ra là ta cần phải ước lượng (xác định một
cách gần đúng) giá trị của tham số .
Trong chương này, giá trị cần ước lượng  được đề cập đến giới
hạn ở trung bình tổng thể và hiệu của 2 trung bình tổng thể.
Phương pháp: Từ tổng thể nghiên cứu, người ta rút ra 1 mẫu
ngẫu nhiên kích thước n (gọi là mẫu thực nghiệm _ empirical) và
từ đó xây dựng một hàm thống kê = f( X
1 , X
2 , .., X
n) dùng để
ước lượng  bằng cách này hay cách khác, gọi là hàm ước lượng
(estimator). Trong trường hợp có 2 tổng thể nghiên cứu, người
ta lấy ra từ mỗi tổng thể 1 mẫu, sau đó xây dựng hàm ước lượng.
254
Chương 4b: LÝ THUYẾT ƯỚC LƯỢNG θ
Chương 4: L{ thuyết mẫu và LT ước lượng

4.11 Một số tiêu chuẩn của hàm ước lượng (tk):
Có nhiều cách chọn hàm ước lượng khác nhau, vì vậy người ta đưa
ra một số tiêu chuẩn để đánh giá chất lượng của các hàm này, để từ đó
lựa chọn được hàm “xấp xỉ một cách tốt nhất” với tham số  cần ưl.
•Ước lượng không chệch: là hàm ước lượng không chệch của 
nếu E( ) = .
•Ước lượng hiệu quả: là ước lượng hiệu quả của  nếu nó là ước
lượng không chệch của  và có phương sai nhỏ nhất so với các ước
lượng không chệch khác được xây dựng trên cùng mẫu đó.
•Ước lượng vững: là ước lượng vững (hay ước lượng nhất quán)
của  nếu hội tụ theo xác suất đến  khi n .
•Ước lượng đủ: được gọi là ước lượng đủ nếu nó chứa toàn bộ các
thông tin trong mẫu về tham số  của ước lượng.
Tham khảo
255 θ θ θ θ θ θ θ Chương 4: L{ thuyết mẫu và LT ước lượng

Phương pháp ước lượng hợp lý cực đại:
Có nhiều phương pháp ước lượng tổng quát như phương pháp
moment, phương pháp Bayes, phương pháp minimax,.., nhưng thông
dụng nhất là phương pháp ước lượng hợp lý cực đại (maximal
likelyhood). Phương pháp này do Ronald Fisher đề ra, nó là một trong
những phương pháp quan trọng và hay dùng nhất để tìm hàm ước
lượng.
Giả sử ta đã biết phân phối xác suất tổng quát của biến ngẫu nhiên gốc
X dưới dạng hàm mật độ f(x, ). Đó cũng có thể là biểu thức xác suất
nếu X là biến ngẫu nhiên rời rạc. Để ước lượng , ta lấy mẫu ngẫu
nhiên (X
1,X
2,…,X
n) và lập hàm số: L()= f(X
1, ). f(X
2, )….f(X
n, ).
Hàm L được gọi là hàm hợp lý của mẫu, nó phụ thuộc vào X
1, X
2,….,X
n
và  nhưng ta coi X
1, X
2,….,X
n là các hằng số, còn  được coi là biến số.
Từ đó tìm hàm ước lượng phụ thuộc X
1, X
2,….,X
n sao cho L() đạt
GTLN tại .
Tham khảo
256 Chương 4: L{ thuyết mẫu và LT ước lượng θ

257 Chương 4: L{ thuyết mẫu và LT ước lượng
Tham khảo

4.12 Có 2 phương pháp ước lượng: ƯL điểm và ƯL khoảng.
- ƯL điểm là dùng một tham số thống kê mẫu đơn lẻ để ước
lượng giá trị tham số của tổng thể. Ví dụ dùng một giá trị cụ
thể của trung bình mẫu để ước lượng trung bình tổng thể .
Ví dụ: Khảo sát thu nhập hàng tháng của 50 công nhân được lựa chọn
ngẫu nhiên từ các xí nghiệp may trong khu vực, người ta tính được thu
nhập bình quân của 50 người này là 8.2 triệu đồng. Phương pháp ước
lượng điểm cho phép ta đánh giá thu nhập trung bình của mỗi công
nhân ở các nhà máy này là 8.2 triệu.
Một nhược điểm cơ bản của phương pháp ước lượng điểm là khi
kích thước mẫu chưa thực sự lớn thì ước lượng điểm tìm được có
thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt
khác, việc sử dụng các phương pháp ước lượng đều có thể gặp sai
lầm, nhưng phương pháp ƯL điểm không đánh giá được khả năng
mắc sai lầm là bao nhiêu.
258 Chương 4: L{ thuyết mẫu và LT ước lượng

-Ước lượng bằng khoảng tin cậy chính là tìm ra khoảng ước
lượng (G
1;G
2) cho tham số  trong tổng thể sao cho ứng với
độ tin cậy (confidence) bằng  cho trước, P( G
1 <  < G
2 ) =  .
Phương pháp ƯL bằng khoảng tin cậy có ưu thế hơn
phương pháp ƯL điểm vì nó làm tăng độ chính xác của
ước lượng và còn đánh giá được mức độ tin cậy của ước
lượng.
Khả năng mắc sai lầm của phương pháp là = 1-  .
Trong thống kê, người ta dùng ký hiệu  để biểu diễn cho giá
trị xác suất nhỏ. Vì vậy, kí hiệu 1-  còn được dùng để biểu
diễn độ tin cậy của khoảng ước lượng.
259 Chương 4: L{ thuyết mẫu và LT ước lượng

4.13 TÌM KHOẢNG TIN CẬY CHO THAM SỐ - BÀI TOÁN 1 MẪU:
Phương pháp tìm khoảng tin cậy cho tham số 
với độ tin cậy  = 1- cho trước:
•Trước tiên, tìm hàm ước lượng G = f(X
1 , X
2 , .., X
n , ) sao cho quy
luật phân phối xác suất của G hoàn toàn xác định, không phụ
thuộc vào các đối số. Chọn cặp số 
1, 
2  0 sao cho 
1 + 
2 = 
và tìm G
1, G
2 mà P( G < G
1) =1 & P(G > G
2) = 2; suy ra
P(G
1 < G < G
2) = 1 - . Biến đổi để tìm được các giá trị G
1, G
2
sao cho P(G
1 <  < G
2 ) = 1-. Khi đó khoảng (G
1, G
2) chính là một
trong các khoảng tin cậy (confidence interval) cần tìm.
•Theo nguyên lý xác suất lớn thì với độ tin cậy (1 -) đủ lớn, hầu
như chắc chắn biến cố (G
1 <  < G
2 ) sẽ xảy ra trong một phép thử.
Vì vậy trong thực tế chỉ cần thực hiện phép thử để có được một
mẫu cụ thể w = (x
1, x
2 , .., x
n) rồi tính giá trị của G
1 và G
2 ứng với
mẫu đã cho sẽ cho ta một khoảng ước lượng thỏa yêu cầu.
260 Chương 4: L{ thuyết mẫu và LT ước lượng

Bảng 2 - PHÂN PHỐI XS CỦA TRUNG BÌNH MẪU & TỶ LỆ MẪU
261 Chương 4: L{ thuyết mẫu và LT ước lượng

262
* Nhắc lại khái niệm mức phân vị trên z
 và z
/2 của phân phối
chuẩn tắc Z N(0; 1) :
•Mức phân vị  (mức phân vị trên) là giá
trị z
 mà P( Z  z
 ) = (z
) = 1- .
•Mức phân vị /2 (mức phân vị trên) là giá
trị z
/2 mà P( Z  z
/2 ) = (z
/2) = 1- /2.
Cách tìm z
 :
Cách 1: Tra ngược bảng Hàm phân phối chuẩn tắc.
Cách 2: Sử dụng chức năng hàm ngược của hàm  trong MTBT, làm tròn kết
quả đến 2 chữ số phần thập phân.
Thực hành với  = 6%. (z
) = 1- 0.06 = 0.94  z
 = 1.55
(z
/2) = 1- 0.06/2 = 0.97  z
/2 = 1.88


Chương 3: Một số dạng phân phối XS thông dụng

Bài toán minh họa 1: Xét mẫu tổng quát có kích thước n >30 và
tỉ lệ mẫu F. Ký hiệu f là tỉ lệ của một mẫu cụ thể. Tìm khoảng tin
cậy đối xứng cho tỉ lệ tổng thể p với độ tin cậy  = 1-.
a)
263 Chương 4: L{ thuyết mẫu và LT ước lượng

b) Nếu ta chọn 
1= 0 và 
2=  thì P( -  < Z < z
 ) = 1-  .












c) Nếu ta chọn 
1=  và 
2= 0 thì ta sẽ thiết lập được khoảng
ước lượng bên phải của p.
264 Chương 4: L{ thuyết mẫu và LT ước lượng

Nhận xét:
* Có vô số khoảng ước lượng cho giá trị p của tổng thể tùy theo
cách chọn 
1, 
2 sao cho 
1 + 
2= 
. Đối với bài toán ƯL tỉ lệ
hay ƯL trung bình thì khoảng ƯL đối xứng được thiết lập khi
lựa chọn 
1 = 
2 = /2 (như trong ví dụ trên) chính là khoảng
ƯL có độ dài ngắn nhất.
* Đối với một mẫu đã xác định, khoảng ước lượng đối xứng có
độ dài càng hẹp thì độ tin cậy càng thấp. Nếu chúng ta muốn
có được ngưỡng sai số nhỏ (khoảng tin cậy hẹp) và độ tin cậy
như mong muốn thì chúng ta phải tăng kích thước mẫu hợp
lý. ( xem ở mục Lưu ý phiá sau Bảng 3)
265 Chương 4: L{ thuyết mẫu và LT ước lượng

Bài toán minh họa 2: Giả sử tổng thể có phân phối chuẩn, chưa
biết trung bình µ và phương sai 
2
. Người ta lấy được mẫu tq với
kích thước n, trung bình mẫu và 1 phương sai mẫu cụ thể s
2
.
Tìm khoảng tin cậy cho trung bình tổng thể µ với độ tin cậy 1- .
266 Chương 4: L{ thuyết mẫu và LT ước lượng

Bảng 3: Các khoảng ước lượng thông dụng với độ tin cậy 1- 
Bài toán ước lượng 1 mẫu












267 Chương 4: L{ thuyết mẫu và LT ước lượng

Lưu ý:
1) Cách tìm giá trị z
α/2 thỏa (z
α/2)= 1- α/2 :
Cách 1: Tra ngược bảng Hàm phân phối chuẩn tắc.
Cách 2: Bấm mò qua phím chức năng P( ? ) = 1- α/2
Cách 3: SD chức năng hàm ngược của MTBT Casio 580 VNX
2) Giá trị z
α thỏa (z
α)= 1- α; được tìm tương tự.
3) Tìm giá trị t
/2;(n-1) : tra bảng phân vị Student ,cột /2; dòng
n-1. Tra bảng tương tự với t
;(n-1) .

4)Bài toán ngược: Tìm kích thước mẫu n phù hợp với  đã cho.
•Yêu cầu giá trị n là số nguyên, được làm tròn lên từ kết quả.
•Dạng bài ƯL tỉ lệ có 2 lời giải tìm n ( xem minh hoạ ở vd 6) .
Kết quả tương đối: sử dụng f ở mẫu sơ bộ thay thế cho p.
Kết quả tuyệt đối: sử dụng công thức n  ( z
/2 / 2)
2
THỐNG NHẤT
268 Chương 4: L{ thuyết mẫu và LT ước lượng

269 Chương 4: L{ thuyết mẫu và LT ước lượng

270 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 4a: Tìm khoảng ƯL đối xứng cho tỉ lệ hạt lúa nảy mầm
với độ tin cậy 98% trên cơ sở gieo 1000 hạt thì có
140 hạt không nảy mầm.
Hướng dẫn:
Gọi p là tỉ lệ hạt nảy mầm của tổng thể .
Khoảng UL cần tìm cho p có dạng ( f- ; f + ).
Tính các đặc trưng mẫu: n = 1000; f= 860/1000 = 0.86.
Độ tin cậy 1 -  = 0.98  (z
/2) = 1-/2 = 0.99  z
/2 = 2.33.
Tìm ngưỡng sai số (hay là độ chính xác) của ƯL:


 KƯL cần tìm: (0.8344; 0.8856) = (83.44%; 88.56%)
271 /2
(1) 2.330.860.14
0.0256
1000
zff
n


 
   Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 4b: a) Tìm sai số chuẩn của tỷ lệ mẫu trong bài toán.
b) Tìm các KƯL một phía cho tỷ lệ hạt lúa nảy mầm với độ tin
cậy 98% trên cơ sở gieo 1000 hạt thì có 140 hạt không nảy mầm.
Hướng dẫn:
a)
b) Độ tin cậy 1 -  = 0.98  (z
) = 1- = 0.98  z
 = 2.05.
* Khoảng tin cậy bên trái cho p:

* Khoảng tin cậy bên phải cho p:

272 1
2.05*0.86(10.86)
(;)0.86 ;1.
1000
f
 


 1
2.05*0.86(10.86)
(0;)0;0.86 .
1000
f
 
 

 Chương 4: L{ thuyết mẫu và LT ước lượng f(1-f)0.86*0.14
se (F)= 0.0110
n1000


Lưu ý:
Vì tỉ lệ p là 1 số, không phải BNN nên từ kết quả ở bài VD 4a), ta
nhận thấy thực tế chỉ xảy ra 1 trong 2 khả năng:
1. Nếu p (0.8344; 0.8856) _ tức là KƯL đưa ra đúng.
2. Nếu p ( 0.8344; 0.8856)_ kết quả sai, hay KƯL trên không
chứa p.
Do đó người ta không viết P(0.8344 <p < 0.8856) = 98%.
Độ tin cậy 98% được hiểu là nếu xét tất cả các khoảng ƯL đối
xứng được xây dựng theo cách trên, (các khoảng ƯL này khác
nhau do được tính trên các mẫu cụ thể khác nhau), thì có 98%
KƯL chứa giá trị p và 2% KƯL không chứa p.
Theo nguyên lý xác suất lớn, vì mẫu ta có là ngẫu nhiên nên xem
như KƯL ta tìm được sẽ chứa p.
273 Chương 4: L{ thuyết mẫu và LT ước lượng

Mô hình dưới đây minh họa cho lưu ý trên.
Gọi p là xác suất một đồng xu xuất hiện mặt sấp khi được tung
ngẫu nhiên.
Bây giờ ta tìm khoảng ƯL đối xứng cho p, với  =90%, bằng
cách thực hiện tung ngẫu nhiên đồng xu n = 20 lần độc lập.
Lặp lại cách trên để có 50 khoảng tin cậy 90%.
Ta đã biết p = ½.
Hãy đếm số khoảng tin cậy chứa p; số khoảng tin cậy không
chứa p và nêu nhận xét.

(Giả thiết n*F  5 và n*(1-F)  5 ).
274 Chương 4: L{ thuyết mẫu và LT ước lượng

275 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 5: Trong đợt vận động bầu cử ở một bang có khoảng 4
triệu cử tri, người ta phỏng vấn 1600 cử tri thì có 960 cử tri
ủng hộ ứng cử viên A. Với độ tin cậy 97% , hãy dự đoán xem
ứng cử viên A có khoảng bao nhiêu phiếu ủng hộ ở bang này?
Hướng dẫn:
Gọi p là tỉ lệ cử tri ủng hộ ƯCV A trong toàn bang .
Tính các đặc trưng mẫu: n = 1600; f= 960/1600 = 0.6.
Đtc 0.97 = 0.03  (z
/2) = 1-/2 = 0.985  z
/2 = 2.17.
Tìm ngưỡng sai số của ƯL:


 KƯL đối xứng cho p: (f-; f+) = (0.5734; 0.6266)
KƯL cho số phiếu cần tìm: (0.5734 4.10
6
; 0.6266 4.10
6
)
276 /2
(1) 2.170.60.4
0.0266
1600
zff
n


 
   Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 6:
Người ta muốn ước lượng tỉ lệ phế phẩm trong một lô hàng mới
nhập về với độ tin cậy 99% và sai số không vượt quá 3%. Hãy cho
biết để thỏa yêu cầu đó người ta phải kiểm tra ít nhất bao nhiêu
sản phẩm với mỗi giả thiết sau:
a) Người ta đã lấy một mẫu sơ bộ thì thấy tỉ lệ phế phẩm trong
mẫu này là 20%.
b) Chưa có thông tin gì liên quan đến tỉ lệ phế phẩm của lô hàng.
Hướng dẫn: LờI giải câu b) là được quy ước.
277 Chương 4: L{ thuyết mẫu và LT ước lượng

Hướng dẫn: 1- = 0.99   z
/2= 2.58.





278 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 7:
Để điều tra số cá trong một hồ, cơ quan quản lý đánh bắt 300
con, làm dấu rồi thả xuống hồ. Lần sau người ta bắt ngẫu nhiên
400 con thì thấy có 60 con đã được đánh dấu.
Hãy xác định số cá trong hồ với độ tin cậy 96%.
Hướng dẫn:
n = 400; f = 60/400 = 0.15 là tỉ lệ cá được đánh dấu trong mẫu.
Gọi p là tỉ lệ cá được đánh dấu trong hồ và N là số cá có trong hồ.
Từ giả thiết suy ra p = 300/N.
Trước tiên tìm KƯL cho p ở dạng: ( f - ; f + )
Suy ra f -  < 300/N < f +   Khoảng ƯL cho N.


279 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 8:
Người ta đo ngẫu nhiên đường kính (có phân phối chuẩn và đơn
vị là mm) của 24 trục máy do một loại máy tiện làm ra thì có kết
quả dưới đây.
Với độ tin cậy 95 %, hãy tìm các khoảng ước lượng đối xứng;
khoảng ước lượng bên trái và khoảng ước lượng bên phải cho
đường kính trung bình của trục máy.
24.1; 27.2; 26.7; 23.6; 24.6; 24.5; 26.4; 26.1;
25.8; 27.3; 23.2; 26.9; 27.1; 25.4; 23.3; 25.9;
22.7; 26.9; 24.8; 24.0; 23.4; 23.0; 24.3; 25.4.
Hướng dẫn: Tìm các đặc trưng mẫu:
280 24;25.1083;1.5036nx s  Chương 4: L{ thuyết mẫu và LT ước lượng

Kí hiệu µ là đường kính trung bình trục máy.
a) KƯL đối xứng cho đường kính trung bình trục máy có dạng:

Do đường kính trục máy có phân phối chuẩn và chưa biết 
2
nên
ta sử dụng bảng tra Student.
t
/2 (n-1) = t
0.025 (24-1) = 2.069
Tính ngưỡng sai số :

KƯL cho µ : ( 25.1083 - 0.6350; 25.1083 + 0.6350)

Lưu ý: Trong trường hợp n lớn và không đủ điều kiện để tìm
phân vị Student (tra bảng n lớn, dùng phần mềm), ta có thể lựa
chọn tìm gần đúng bằng cách tra bảng của phân phối chuẩn tắc.
281 ;(1)
2
1.5036
t 2.0690.6350
24
n
s
n



 (;)xx Chương 4: L{ thuyết mẫu và LT ước lượng

Kí hiệu µ là đường kính trung bình trục máy.
b)KƯL bên trái cho µ có dạng:



c)KƯL bên phải cho µ có dạng:



hoặc:
282  1 ;(1)
1.5036
; ;25.10831.714;
24
n
s
x xt
n



 

 
  1 ;(1)
1.5036
; ; ;25.10831.714
24
n
s
x xt
n



 

 
 1.5036
0;25.10831.714
24



 Chương 4: L{ thuyết mẫu và LT ước lượng

283 Chương 4: L{ thuyết mẫu và LT ước lượng

284 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 9:
Để xác định giá trung bình của mặt hàng B trên thị trường, người
ta khảo sát ngẫu nhiên 100 cửa hàng và thu được số liệu:



a) Hãy tìm sai số chuẩn của trung bình mẫu trong bài toán ƯL.
b) Hãy tìm khoảng tin cậy cho giá trung bình của loại hàng hóa
trên tại thời điểm đang xét với độ tin cậy 97% .
c) Nếu muốn độ dài của khoảng ước lượng không vượt quá 600
đồng và độ tin cậy của ước lượng là 99% thì cần phải điều tra
thêm ít nhất bao nhiêu cửa hàng?
d) Với độ tin cậy 98%, hãy ƯL số cửa hàng trong 8000 cửa hàng ở
vùng đó bán thấp hơn giá bán lẻ 88 ngàn mà công ty đề nghị.
285 Chương 4: L{ thuyết mẫu và LT ước lượng

Hướng dẫn:

b) KƯL cho giá bán trung bình () của mặt hàng này có dạng:

Ngưỡng sai số của ước lượng:

KƯL cần tìm: (86.76-0.4116; 86.76+0.4116)= (86.3484; 87.1716)
c) Từ công thức: nN
+
, làm tròn lên.


KQ: Cần khảo sát thêm 267 – 100 = 167 cửa hàng nữa.
Lưu ý: Trong công thức trên, ’; z
/2’ và n’ là các kí hiệu trong mẫu
cần tìm. Nhưng giá trị s’ được lấy bằng giá trị s từ mẫu ban đầu đã
có, mẫu này gọi là mẫu sơ bộ.


286 2
/2 /2
zszs
n
n



 


 2
2.581.8969
'0.3' 266.1251'267.
0.3
Do n n

 

 /2 2.171.8969
0.4116
100
zs
n


 
  (;).xx 100;86.76;1.8969nxs Chương 4: L{ thuyết mẫu và LT ước lượng 7a
1
)
s.8969
se (X) = 0.189
n100


d) Tỉ lệ cửa hàng bán thấp hơn giá 88 ngàn trong mẫu: f = 0.7
Gọi p là tỉ lệ cửa hàng bán thấp hơn giá của công ty trong vùng.
KUL cho p là ( f-; f+);

Nhân 2 vế của KUL p với 8000, ta suy ra KUL cần tìm cho số cửa
hàng.
Ví dụ 10: Biết rằng thời gian thi công một chi tiết máy tuân
theo quy luật phân phối chuẩn. Để định mức thời gian gia công
một chi tiết máy, người ta theo dõi ngẫu nhiên quá trình thi
công của 25 chi tiết và có được số liệu ở bảng sau:


Hãy tìm khoảng ước lượng cho thời gian gia công trung bình
một chi tiết máy với độ tin cậy 0.95.
287 /2
(1) 2.330.70.3
0.1068
100
zff
n


 
   Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 11:
Để ước lượng doanh thu của 1 công ty có 380 cửa hàng trên
toàn quốc trong 1 tháng, người ta chọn ngẫu nhiên 10% số cửa
hàng và có bảng thống kê doanh thu trong 1 tháng như sau:


a) Với độ tin cậy 97%, hãy ƯL doanh thu trung bình của mỗi cửa
hàng và doanh thu trung bình của công ty trong 1 tháng.
b) Nếu lấy độ dài của KƯL doanh thu trung bình mỗi cửa hàng
trong 1 tháng là 6 triệu đồng thì độ tin cậy của khoảng ƯL khi đó
là bao nhiêu?
288 Doanh thu (triệu đồng / tháng) 20 40 60 80
Số cửa hàng 8 16 12 2
Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 12:
Trọng lượng sản phẩm do một máy đóng gói là biến ngẫu nhiên
tuân theo quy luật chuẩn với độ lệch chuẩn là 2.5 gram. Để ước
lượng trọng lượng trung bình, người ta cân ngẫu nhiên 16 sản
phẩm thì có được số liệu:
a) Hãy ước lượng trọng lượng trung bình của sản phẩm với độ
tin cậy 95%.
b) Nếu muốn độ dài khoảng tin cậy trong câu a) không vượt quá
0.4 gram thì cần phải cân bao nhiêu sản phẩm?
c) Nếu người ta sử dụng mẫu đã có và quy ước lấy độ dài khoảng
ước lượng đối xứng là 1 gram thì độ tin cậy tương ứng của
khoảng ước lượng là bao nhiêu?
(Lưu ý: Vừa cho , vừa có s  Sử dụng  )

289 124.5;2.35xgramsgram Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 13: Khảo sát chiều cao và cân nặng của một số bé trai 10
tuổi được lựa chọn ngẫu nhiên trong vùng, người ta có được số
liệu mẫu dưới đây:



290
Y=Cân nặng (kg) 20-30 30-40 40-50 50-60
X=Chiều cao (cm)

110-120 2 5
120-130 4 9 6
130-140 3 15 25 1
140-150 12 20 2
150-160 2 10 4
Chương 4: L{ thuyết mẫu và LT ước lượng

Với độ tin cậy 95%, hãy tìm các khoảng ước lượng cho:
a)Chiều cao trung bình và cân nặng trung bình của trẻ em trong
vùng ở độ tuổi này.
b)Nếu muốn 2 khoảng ƯL trong câu a) có sai số tương ứng
không vượt quá lần lượt là 1.5 cm và 1 kg thì ta cần lấy mẫu
có kích thước tối thiểu là bao nhiêu?
c)Tỉ lệ trẻ có chiều cao từ 150 cm trở lên ở độ tuổi 10.

Giả thiết chiều cao và cân nặng của các bé trai ở độ tuổi này
tuân theo quy luật phân phối chuẩn.
HD: a) n=120;
b) n’ = max{ n
1 , n
2} ; c) n = 120

291 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 14: Khảo sát thời gian gia công của 1 số chi tiết máy được
chọn ngẫu nhiên, người ta ghi nhận số liệu:


Những chi tiết được gia công dưới 19 phút gọi là chi tiết được gia
công nhanh.
a)Với độ tin cậy 99%, hãy tìm các khoảng ước lượng đối xứng cho:
a
1) Thời gian gia công trung bình 1 chi tiết.
a
2) Tỉ lệ chi tiết được gia công nhanh.
a
3) Thời gian gia công trung bình của mỗi chi tiết được g.công nhanh.
GT thời gian gia công các chi tiết này tuân theo pp chuẩn.
b) Nếu muốn khoảng tin cậy 99% cho thời gian gia công trung bình 1
chi tiết có chiều dài là 1 phút thì cần phải khảo sát bao nhiêu chi tiết?
c) Tìm khoảng tin cậy 95% cho số các chi tiết được gia công nhanh
trong 1500 chi tiết của phân xưởng.
d) Tìm KUL 95% cho tổng thời gian cần có để gia công 1500 chi tiết.
292 Chương 4: L{ thuyết mẫu và LT ước lượng

4.14 TÌM KHOẢNG TIN CẬY CHO THAM SỐ - BÀI TOÁN 2 MẪU:
Xét đồng thời 2 tổng thể. Gọi X
1; X
2 lần lượt là các biến ngẫu
nhiên gốc từ tổng thể thứ 1 và tổng thể thứ 2.
E(X
1) = 
1 ; E(X
2) = 
2
V (X
1) = 
1
2
; V(X
2) = 
2
2

Từ tổng thể thứ nhất lấy ra một mẫu có kích thước n
1; trung
bình mẫu và phương sai mẫu s
1
2
.
Từ tổng thể thứ 2 lấy ra một mẫu có kích thước n
2; trung bình
mẫu và phương sai mẫu s
2
2
.

293 Chương 4: L{ thuyết mẫu và LT ước lượng 1
X 2
X

Bảng 4: PHÂN PHỐI XÁC SUẤT CỦA HIỆU 2 TRUNG BÌNH MẪU
294 Chương 4: L{ thuyết mẫu và LT ước lượng

295 Chương 4: L{ thuyết mẫu và LT ước lượng
Bảng 4. (tiếp theo) … & HIỆU 2 TỶ LỆ MẪU

Bảng 5: Các khoảng ước lượng thông dụng với độ tin cậy 1- 
Bài toán ước lượng 2 mẫu













296 Chương 4: L{ thuyết mẫu và LT ước lượng

297 Chương 4: L{ thuyết mẫu và LT ước lượng

Ví dụ 15:
Giả sử điểm thi môn GT1 và GT2 của mỗi sinh viên năm nhất là
các biến ngẫu nhiên có phân phối chuẩn.
a) Khảo sát điểm thi GT1 của 12 sinh viên và GT2 của 15 sinh viên
được lựa chọn ngẫu nhiên, ta thu được các số liệu mẫu sau:

Hãy tìm khoảng ước lượng với độ tin cậy 99% cho chênh lệch
điểm trung bình môn GT1 và GT2 của sinh viên năm nhất.
b) Khi khảo sát ngẫu nhiên 40 sinh viên về điểm GT1 thì có 37
sinh viên đạt yêu cầu. Với môn GT2 thì chỉ có 46 sinh viên đạt
yêu cầu trong số 55 sinh viên. Hãy tìm khoảng tin cậy 99% cho
chênh lệch tỷ lệ sinh viên đạt yêu cầu của môn GT1 và GT2.
298 Chương 4: L{ thuyết mẫu và LT ước lượng

Hướng dẫn:
a) Ký hiệu 
1; 
2 lần lượt là điểm thi trung bình môn GT1 và GT2
của các sinh viên năm nhất.
Do s
1/s
2  [1/2;2] nên bài toán ước lượng 
1-
2 ở dạng 4b).
Phương sai mẫu gộp: s
p=1.38544.
Sai số chuẩn của hiệu 2 trung bình mẫu:

Ngưỡng sai số của khoảng ước lượng:

Khoảng ước lượng cần tìm cho hiệu 2 trung bình 
1-
2 :

299 Chương 4: L{ thuyết mẫu và LT ước lượng 0.01;(12+15-2)
2
t×2.7870.47421.3217SE   12 12
; (0.8712;1.7717)xxxx

b) Ký hiệu p
1; p
2 lần lượt là tỷ lệ sinh viên đạt yêu cầu của môn
GT1 và GT2. Bài toán ước lượng ở dạng 3.
Khoảng ước lượng cho p
1- p
2 có dạng: (f
1-f
2-; f
1-f
2+ )
Sai số chuẩn của hiệu 2 tỷ lệ mẫu:


Ngưỡng sai số của ước lượng:
 = z
/2SE = 2.58 0.0650 = 0.1677.
Khoảng ước lượng cần tìm: (-0.0790; 0.2563).


300 Chương 4: L{ thuyết mẫu và LT ước lượng  
2
211
12
11
SE 0.0650
ffff
nn

 

Ví dụ 16:
Giả sử điểm thi môn GT1 và GT2 của mỗi sinh viên năm nhất là
các biến ngẫu nhiên có phân phối chuẩn.
Khảo sát điểm thi của 9 sinh viên được lựa chọn ngẫu nhiên,
người ta có được các số liệu mẫu sau:




a) Hãy tìm sai số chuẩn của hiệu 2 trung bình mẫu.
b) Hãy tìm khoảng ước lượng với độ tin cậy 99% cho chênh lệch
điểm trung bình môn GT1 và GT2 của mỗi sinh viên năm nhất.
301 Chương 4: L{ thuyết mẫu và LT ước lượng

Hướng dẫn:
Ký hiệu 
1; 
2 lần lượt là điểm thi trung bình môn GT1 và GT2
của các sinh viên năm nhất. Vì 2 mẫu phụ thuộc tương ứng theo
cặp nên BT yêu cầu tìm khoảng ước lượng cho 
1- 
2 ở dạng 4e).



Đặc trưng mẫu D:
a) Sai số chuẩn của hiệu 2 trung bình mẫu:
b) Ngưỡng sai số của khoảng ước lượng cho 
1- 
2 :

Khoảng ước lượng cho 
1- 
2:
302 Chương 4: L{ thuyết mẫu và LT ước lượng 9;0.1111;2.1473
DD
nx s
Tags