1. HQ DON BIEN.pdf jfwejdjknfjejqwnkjffk

duyenvtkk24403b 0 views 82 slides Sep 23, 2025
Slide 1
Slide 1 of 82
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82

About This Presentation

have a nice day


Slide Content

TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
KHOA TOÁN KINH TẾ
KINH TẾ LƯỢNG
TƯƠNG QUAN
VÀ HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
Võ Thị Lệ Uyển
Thành phố Hồ Chí Minh, Ngày 8 tháng 9 năm 2025
VTLU KTL 1 / 161
NỘI DUNG
1
NHẬP MÔN KINH TẾ LƯỢNG
2
ÔN TẬP MỘT SỐ KIẾN THỨC
Toán tử tổng
Hàm số
Biến ngẫu nhiên
3
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN
Dữ liệu song biến
Mối quan hệ giữa hai biến
Hiệp phương sai
Hệ số tương quan
VTLU KTL 2 / 161
NotesNotes

NỘI DUNG
4
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
Mô hình hồi quy tuyến tính đơn biến
Phần dư
Ước lượng các tham số hồi quy
Đánh giá sự phù hợp của mô hình
Suy diễn thống kê cho các tham số hồi quy
Ước lượng cho các tham số hồi quy
Kiểm định giả thuyết về các tham số hồi quy
Các kiểm định chẩn đoán: sử dụng đồ thị phần dư
Dự báo
VTLU KTL 3 / 161
NỘI DUNG
5
QUY TRÌNH PHÂN TÍCH HỒI QUY
6
BÀI TẬP
Bài tập tính toán
Bài tập thực hành
VTLU KTL 4 / 161
NotesNotes

MỤC TIÊU HỌC TẬP
Giới thiệu tổng quan về Kinh tế lượng.
Giới thiệu hệ số tương quan như một công cụ để xác định mối quan hệ
giữa một biến định lượng với một biến định lượng khác.
Giới thiệu mô hình hồi quy tuyến tính đơn biến như một công cụ liên
kết một biến định lượng với một biến định lượng khác.
Đánh giá tính phù hợp của mô hình hồi quy tuyến tính đơn biến với dữ
liệu mẫu.
Sử dụng mô hình hồi quy tuyến tính đơn biến để dự báo giá trị của
một biến từ một giá trị cụ thể của một biến khác.
VTLU KTL 5 / 161
NHẬP MÔN KINH TẾ LƯỢNG
NHẬP MÔN KINH TẾ LƯỢNG
VTLU KTL 6 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Kinh tế lượng là gì?
VTLU KTL 7 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Kinh tế lượng là gì?
Kinh tế lượng làmột tập con của phân tích thống kê
Khoa họccủa việckiểm tra các lý thuyết kinh tế
Được sử dụng đểước lượng các hiệu ứng nhân quả
Được sử dụng đểdự đoán hoặc dự báo
Thườngđược đặc trưng bởi "dữ liệu quan sát"
VTLU KTL 8 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 1 I
Việc giảm sĩ số lớp có ảnh hưởng gì đến kết quả học tập của học
sinh?
Chúng ta đang quan tâm đến kết quả nào?
Hạnh phúc của học sinh?
Việc học của học sinh?
v.v.
Thông thường điểm kiểm tra được sử dụng như một thước đo cho kết
quả học tập của học sinh.
VTLU KTL 9 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 1 II
Quá trình sinh dữ liệu (Data Generating Process - DGP) là gì?
Các nhà khoa học xã hội tin rằng:"có thể học hỏi được nhiều điều
khi xem thế giới như một hệ thống có trật tự và có thể dự đoán
được".
Họ tin rằng điểm kiểm tra (và các kết quả khác)được tạo rabởi một
quá trình có thể dự đoán trước. Quá trình này được gọi làQuá trình
sinh dữ liệu (Data Generating Process - DGP).
⇒Trước khi xem xét dữ liệu, nên suy nghĩ về DGP.
VTLU KTL 10 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 1 III
Suy nghĩ về quá trình sinh điểm kiểm tra
Điểm kiểm tra (Y) được tạo ra bởi một quá trình nhất định.
Những yếu tố (X) nào ảnh hưởng đến điểm kiểm tra của học sinh?
Sĩ số lớp học
Năng lực
Động lực
Thu nhập gia đình
V.v.
VTLU KTL 11 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Mô hình kinh tế lượng
Định nghĩa
Mô hình kinh tế lượng là một mô tả toán học về quá trình sinh dữ liệu.
Xét mô hình kinh tế lượng mô tả cách sinh ra điểm kiểm tra như sau:
Điểm kiểm tra=β0+β1X1+β2X2+. . .+βj·Sĩ số lớp học+. . .+βkXk
Ta thường quan tâm đếntác động riêng lẻcủa một yếu tố lên kết
quả; trong trường hợp này làsĩ số lớp học.
Phần lớn kinh tế lượng làxoay quanh việc ước lượng hệ sốβ.
VTLU KTL 12 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Hệ sốβ
Hệ sốβcho biết sự thay đổi của một yếu tố ảnh hưởng như thế
nào đến kết quả.
βj=
thay đổi điểm kiểm tra
thay đổi sĩ số lớp học
=
∆điểm kiểm tra
∆sĩ số lớp học
Do đó,
∆điểm kiểm tra=βj∆sĩ số lớp học
Sĩ số lớp họctăng lên một đơn vị, các yếu tố khác không đổi, điểm
kiểm tra sẽthay đổi một lượng bằngβj.
βjthể hiệntác động nhân quảcủa sự thay đổi sĩ số lớp học.
VTLU KTL 13 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 2 I
Quá trình:Y=3.5+0.8∗X+e
với,elà b.n.n theo phân phối chuẩn với trung bình=0, phương sai=1.
VTLU KTL 14 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 2 II
Quá trình:Y=3.5+0.8∗X+e
với,elà b.n.n theo phân phối chuẩn với trung bình=0, phương sai=4.
VTLU KTL 15 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Ví dụ 3
Quá trình:Y=3+2∗X−1.5∗X
2
+e
với,elà b.n.n theo phân phối chuẩn với trung bình=0, phương sai=4.
VTLU KTL 16 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Mục tiêu của kinh tế lượng
Nhận xét
•Trong thực tế, ta thường có thể thu thập được dữ liệu.
•Câu hỏi đặt ra là:
⇒Với dữ liệu được quan sát, làm sao tìm lại được quá trình tạo ra
dữ liệu?
VTLU KTL 17 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Mục tiêu của kinh tế lượng
Thiết lập cácmô hình toán họcđể mô tả các mối quan hệ kinh tế
Ước lượng các tham sốnhằm đánh giá mức độ ảnh hưởng của các
biến số
Kiểm định tính vững chắccủa các giả thiết.
Sử dụng các mô hình đã được kiểm định để đưa ra cácdự báo, dự
đoán và mô phỏngcác hiện tượng kinh tế
Đề xuất chính sáchdựa trên các phân tích và dự báo
VTLU KTL 18 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Các loại dữ liệu
Chuỗi thời gian:là chuỗi các số liệu được thu thập trong một thời kỳ
hoặc một khoảng thời gian lặp lại như nhau (ngày, tuần, tháng,
năm. . . ) trong cùng một không gian, một địa điểm
Số liệu chéo:là số liệu về một hay nhiều biến được thu thập tại cùng
một thời điểm (thời kỳ) ở các không gian (địa phương, đơn vị khác
nhau. . . ) khác nhau
Dữ liệu bảng:bao gồm dữ liệu của nhiều công ty và nhiều thời gian.
VTLU KTL 19 / 161
NHẬP MÔN KINH TẾ LƯỢNG
PHÂN TÍCH HỒI QUY?
Phân tích hồi quynghiên cứu mối liên hệ phụ thuộc giữa một biếnYvới
một hay nhiều biếnX, dưới dạng:
Y=f(X)
nhằm ước lượng và/hoặc dự báo giá trị trung bình của biếnYvới các giá
trị đã biết của các biếnX.
Trong đó,
•Yđược gọi làbiến phụ thuộchay biến được giải thích.
•Xđược gọi là một hay cácbiến độc lậphay biến giải thích.
VTLU KTL 20 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
PHÂN TÍCH HỒI QUY?
Ví dụ
Sự phụ thuộc về nhu cầu về một loại hàng hóa phụ thuộc vào giá bản thân
hàng hóa, thu nhập của người tiêu dùng và giá của những hàng hóa khác
cạnh tranh với hàng hóa này.
Biến phụ thuộc: Nhu cầu
Biến độc lập: Giá của bản thân hàng hóa, thu nhập của người tiêu
dùng và giá của những hàng hóa khác cạnh tranh với hàng hóa này
VTLU KTL 21 / 161
NHẬP MÔN KINH TẾ LƯỢNG
PHÂN TÍCH HỒI QUY?
Ví dụ
Năng suất đậu nành và phân bón
Biến phụ thuộc: Năng suất đậu nành
Biến độc lập: Số kg phân bón
VTLU KTL 22 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
PHÂN TÍCH HỒI QUY?
Ví dụ
Lương của CEO và lợi nhuận trên vốn chủ sở hữu.
Đối tượng khảo sát là giám đốc điều hành.
Dữ liệu cần khảo sát gồm:
•Ylà mức lương hàng năm (salary) tính bằng ngàn đô la.

Xlà lợi nhuận trên vốn chủ sở hữu (roe) trung bình trong ba năm trước
của công ty.

Có tồn tại mối quan hệ giữa thước đo hiệu suất công ty và lương
thưởng của CEO không?
VTLU KTL 23 / 161
NHẬP MÔN KINH TẾ LƯỢNG
PHÂN TÍCH HỒI QUY?
Cácbiến trong mô hình hồi quy:
Biến phụ thuộc(hay biến được giải thích)Y, là đại lượng ngẫu
nhiên, có quy luật phân bố xác suất
Biến độc lập(hay biến giải thích)X, không phải là biến ngẫu nhiên,
giá trị của chúng đã được cho trước
Phân tích hồi quygiải quyết các vấn đề sau:
Ước lượnggiá trị trung bình của biến phụ thuộc với giá trị đã cho của
biến độc lập
Kiểm định giả thuyếtvề bản chất của sự phụ thuộc
Dự đoángiá trị trung bình của biến phụ thuộc khi biết giá trị của các
biến độc lập
VTLU KTL 24 / 161
NotesNotes

NHẬP MÔN KINH TẾ LƯỢNG
Các tiếp cận cơ bản của KTL
VTLU KTL 25 / 161
NHẬP MÔN KINH TẾ LƯỢNG
Cấu trúc của học phần KTL
VTLU KTL 26 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC
ÔN TẬP MỘT SỐ KIẾN THỨC
VTLU KTL 27 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Toán tử tổng
Định nghĩa
Công thức
n
X
i=1
xi=x1+x2+. . .+xn
Chỉ sốiđược sử dụng để xác định quan sát thứi.
Ký hiệuΣ
n
i=1
được dùng để biểu diễn tổng của một tập hợpnquan
sát.
VTLU KTL 28 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Toán tử tổng
Tính chất của toán tử tổng I
1
Cộngnlần 1 hằng số:Cộngnlần một hằng sốckhông phụ thuộc
vàoi, được cho bởi công thức:
n
X
i=1
c=c+c+. . .+c=cn
2
Hằng số có thể được đưa ra ngoài dấu tổng
n
X
i=1
cxi=c
n
X
i=1
xi
VTLU KTL 29 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Toán tử tổng
Tính chất của toán tử tổng II
3
Tính chất kết hợp
n
X
i=1
(axi+byi) =a
n
X
i=1
xi+b
n
X
i=1
yi
4
Tổng của phân số không bằng phân số của tổng
n
X
i=1
xi
yi
̸=
P
n
i=1
xi
P
n
i=1
yi
VTLU KTL 30 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Định nghĩa
Hàm sốlà quy tắc liên kết một giá trị của biếnxvới đúng một giá trị
của biếny.
Nếuylà hàm củax, ta viếty=f(x).
Ứng dụng trong kinh tế học:
Hàm cầu và hàm cung: liên kết giá với lượng cầu hoặc lượng cung
Hàm sản xuất: liên kết lượng đầu vào với lượng đầu ra
Hàm chi phí: liên kết lượng đầu ra với chi phí phải trả
Hàm lợi nhuận: liên kết lượng sản xuất với lợi nhuận
Hàm hữu dụng: liên kết lượng với mức độ thỏa dụng
VTLU KTL 31 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Các loại hàm số
Hàm tuyến tính:chỉ có biến, hằng số, hệ số (không có lũy thừa).

Dạng tổng quát:y=f(x) =ax+bvớialà hệ số góc,blà hằng số
(tung độ gốc).
Dạng hàm bậc hai:y=f(x) =ax
2
+bx+c.
Hàm lũy thừa:y=f(x) =ax
b
.
Hàm số mũ:y=f(x) =ab
x
, trong đó,blà cơ số của số mũx.
Hàm logarit:y=f(x) = log
bx, trong đóblà cơ số (Cơ số phổ biến
là số Euler: e≈2,718).
VTLU KTL 32 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Đồ thị của hàm tuyến tính không có hệ số góc
VTLU KTL 33 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Đồ thị của hàm tuyến tính không có hệ số hằng số
Hệ số góc dương(a>0); hệ số góc cũng có thể âm.
VTLU KTL 34 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Đồ thị của hàm tuyến tính có hệ số góc và hằng số
Trường hợp hệ số góc âm(a<0).
VTLU KTL 35 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Hệ số góc của hàm tuyến tính
Hệ số góc của hàm tuyến tính là không đổi trên toàn bộ đường thẳng.
Hệ số góc không đổi khiến hàm tuyến tính rất hữu dụng trong kinh tế
học.
Hệ số góc của hàm số đóng vai trò trực quan quan trọng trong phân
tích kinh tế lượng.
VTLU KTL 36 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Hàm nhiều biến và đạo hàm riêng I
Khihàm số có nhiều biến, sẽcó nhiều đạo hàm riêngtương ứng.
Ví dụ:Xét hàm sốy=f(x,z)
⇒Đạo hàm riêng của hàm số này theo x được ký hiệu:
∂y
∂x
, hoặcf

x.
Ứng dụng trong kinh tế học: Lợi ích cận biên, sản phẩm cận biên
của lao động.
VTLU KTL 37 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Hàm số
Hàm nhiều biến và đạo hàm riêng II
Khi tìm đạo hàm riêng theo 1 biến, ta xem các biến còn lại làhằng số.
Có thểdễ dàngtìm các đạo hàm riêng khikhông có các hạng tử
tương tác(tức là không có biến nào nhân với biến nào).
Ví dụ
Xét hàm sản xuất dạng Cobb-Douglas:Q(L,K) =AK
a
L
1−a
. Ta có:
∂Q
∂K
=aAK
a−1
L
1−a
∂Q
∂L
= (1−a)AK
a
L
−a
VTLU KTL 38 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Định nghĩa
Xđược gọi là một biến ngẫu nhiên khi nó có thể nhận các giá trị khác
nhau dựa trên một phân phối xác suất nhất định.
Có hai loạibiến ngẫu nhiên:
1
Dạng rời rạc: Các giá trị có thể có là hữu hạn hoặc một vô hạn đếm
được.
2
Dạng liên tục: Các giá trị có thể có (vô số giá trị) thuộc một hoặc
nhiều khoảng.
VTLU KTL 39 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Phân phối xác suất
Phân phối xác suất của b.n.nXđược cho bởi hàm xác suất:
Pr (x=xi) =f(xi)∈[0,1]
X
i∈I
f(xi) =1
VTLU KTL 40 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Mô tả một biến ngẫu nhiên
Kỳ vọng (Trung bình)
Làtrung bình có trọng số xác suấtcủa tất cả các giá trị mà biến
ngẫu nhiên nhận được.
E(x)≡
X
i∈I
xif(xi)
Phương sai.
Là trung bình có trọng số xác suất củabình phương các độ lệchso
với giá trị trung bình.
σ
2
= Var(x)≡
X
i∈I
(xi−E(x))
2
f(xi)
VTLU KTL 41 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Kỳ vọng của một biến ngẫu nhiên
Các tính chất:
Kỳ vọng của một hằng sốclà
E(c) =c
.
Hằng số có thể "kéo ra ngoài" dấu kỳ vọng:
E(ax+b) =aE(x) +b
Kỳ vọng có tính chất giao hoán:
E

n
X
i=1
aixi
!
=
n
X
i=1
aiE(xi)
VTLU KTL 42 / 161
NotesNotes

ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Phương sai của một biến ngẫu nhiên
Các tính chất:
Các tính chất của kỳ vọng cũng áp dụng cho phương sai vì phương sai
có thể được viết dưới dạng kỳ vọng:
Var(x) =E(x−E(x))
2
=E

x
2

−[E(x)]
2
NếuPr(x=c) =1 xlà 0.
Hằng số "kéo ra ngoài" như sau:
Var(ax+b) =E[ax+b−E(ax+b)]
2
=E[a(x−E(x))]
2
Var(ax+b) =E[a
2
(x−E(x))
2
] =a
2
Var(x)
VTLU KTL 43 / 161
ÔN TẬP MỘT SỐ KIẾN THỨC Biến ngẫu nhiên
Phương sai của một biến ngẫu nhiên
Tính chất mở rộng
Var(ax+by) =E[a(x−E(x)) +b(y−E(y))]
2
=E
h
a
2
(x−E(x))
2
+b
2
(y−E(y))
2
+2ab(x−E(x))(y−E(y))
i
Suy ra:
Var(ax+by) =a
2
Var(x) +b
2
Var(y) +2abCov(x,y)
NếuXvàYđộc lập⇒Cov(X,Y) =0, khi đó:
Var

X
i∈I
aixi
!
=
X
i∈I
a
2
iVar(xi)
VTLU KTL 44 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN
VTLU KTL 45 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Dữ liệu song biến
Giới thiệu I
Hầu hết các ứng dụng thống kê trong kinh tế và kinh doanh đều tìm
hiểu mối quan hệgiữacác biến, chẳng hạn:
Số lượng cảnh sát & tỷ lệ tội phạm
Chi tiêu y tế & tuổi thọ trung bình
Chi tiêu chính phủ & tăng trưởng GDP
Lượng khí thải carbon dioxide & nhiệt độ toàn cầu
Giá nhà & diện tích nhà
VTLU KTL 46 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Dữ liệu song biến
Giới thiệu II
Trong bài giảng này, chúng ta sẽ làm việc với dữ liệusong biến (hai
biếnXvàY)nhằm xem xét mối liên hệ giữa chúng, từ đó:
Khám phámối liên hệgiữa hai biến,
Lượng hóa mối quan hệ giữa hai biến bằnghệ số tương quanvàhồi
quy tuyến tính đơn biến
Phát triển các công cụ nâng cao hơn để lập luận vềquan hệ nhân quả
VTLU KTL 47 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Dữ liệu song biến
Dữ liệu song biến được biểu diễn như thế nào?
* Đọc dữ liệu
import delimited "econfreedom.csv", clear
* Xem xét 5 quan sát đầu tiên
list in 1/5
country ef gdp
1 Albania 7.4 4543.088
2 Algeria 5.15 4784.194
3 Angola 5.08 4153.146
4 Argentina 4.81 10501.66
5 Australia 7.93 54688.45
Các dònglà các quan sát
Các cộtlà các biến, trong đó:eflàEconomic Freedomvàgdplà
GDP per capita
VTLU KTL 48 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Dữ liệu song biến
Quan sát dữ liệu
. describe
Biến nào là biến phụ thuộc? Biến nào là biến giải thích?
VTLU KTL 49 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Dữ liệu song biến
Tóm tắt dữ liệu
. summarize
Thông tin thu được từ bộ dữ liệu này là gì?
VTLU KTL 50 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Các thuộc tính quan trọng
Mối liên hệgiữa hai biến bao gồm các thuộc tính:
1
Chiều hướng: xu hướng đồng biến hay nghịch biến?
2
Dạng: tuyến tính (đường thẳng), bậc hai,..., hay không có quy luật nào?
3
Mức độ mạnh/yếu: mối quan hệ đó mạnh hay yếu?
4
Giá trị ngoại lệ: có giá trị nào phá vỡ các thuộc tính trên không?
VTLU KTL 51 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Trực quan hóa mối quan hệ I
Xéthai biến định lượngXvàY(là hai biến mà dữ liệu được thu
thập bằng thang đo tỷ lệ)
Cách tốt nhất đểtrực quan hóa mối liên hệgiữa hai biến này là sử
dụngmột đồ thị phân tán (scatterplot)
Đồ thị phân tánđược vẽbằng cách:
1
Biểu diễn biến độc lập(X)dọc theo trục hoành (trục ngang).
2
Biểu diễn biến phụ thuộc(Y)dọc theo trục tung (trục dọc).
3
Mỗi quan sát được biểu diễn bằng một chấm tròn trên đồ thị.
VTLU KTL 52 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Trực quan hóa mối quan hệ II
VTLU KTL 53 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Trực quan hóa mối quan hệ III
Trong mỗi đồ thị trên, giữa X và Y có mối quan hệ như thế nào?
VTLU KTL 54 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Trực quan hóa mối quan hệ IV
. graph twoway (scatter gdp ef)
Có nhận xét gì về
mối liên hệ giữa GDP
bình quân đâu người
và Tự do kinh tế?
VTLU KTL 55 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Mối quan hệ giữa hai biến
Trực quan hóa mối quan hệ V
Ví dụ.Mối quan hệ giữatỷ lệ tốt nghiệp trung họcở các tiểu bang của
Hoa Kỳ và% cư dân sống dưới mức nghèo khổ(thu nhập dưới
$23050/gia đình có 4 người vào năm 2012), được thể hiện trong hình sau:80 85 90
6
8
10
12
14
16
18
% HS grad
% in poverty
Biến nào là biến phụ thuộc?
•% nghèo đói
Biến nào là biến nguyên nhân?
•% tốt nghiệp trung học
Mối quan hệ này như thế nào?
•Tuyến tính, nghịch biến,
tương quan khá mạnh.
VTLU KTL 56 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hiệp phương sai
Hiệp phương sai I
Hiệp phương sai mẫu, ký hiệu làcov(X,Y)hoặcsXYđược sử dụng
để định lượng mức độ biến thiêncùng nhaucủa 2 biếnXvàY.
Hiệp phương sai mẫu được tính theo công thức:
sXY=E
ˆ
(X−¯X)(Y−¯Y)
˜
Hiệp phương sai là một chỉ số phổ biến, tuy nhiên đơn vị đo của nó
không có ý nghĩa thực tiễn, vì vậy hiếm khi được sử dụng.
Lưu ý:Thông thường, ta chỉ xét hiệp phương sai mẫu.
Hiệp phương sai tổng thể được ký hiệu làσXY
VTLU KTL 57 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hiệp phương sai
Hiệp phương sai II
Tính hiệp phương sai mẫu giữa GDP/người và Tự do kinh tế?
Câu hỏi:
Có mối quan hệ gì giữa GDP bình quân đầu người và Tự do kinh tế?
VTLU KTL 58 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hiệp phương sai
Hiệp phương sai III
Tính hiệp phương sai mẫu giữa % nghèo và % tốt nghiệp TH?
Câu hỏi:
Có mối quan hệ gì giữa Tỷ lệ nghèo và Tỷ lệ tốt nghiệp trung học?
VTLU KTL 59 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan I
Hiệp phương sai mẫu đượcchuẩn hóathành một khái niệm trực quan
hơn, gọi làhệ số tương quan mẫu (ký hiệu:rXY)
Hệ số tương quan mẫu được tính theo công thức:
rXY=
SXY
SXSY
=
cov(X,Y)
sd(X)sd(Y)
Hay:
rXY=
1
n−1
n
X
i=1

Xi−X
SX
«„
Yi−Y
SY
«
=
1
n−1
n
X
i=1
ZXZY
VTLU KTL 60 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan II
Nhận xét
Hệ số tương quanmô tảcường độ của mối liên hệ tuyến tínhgiữa
hai biến định lượng.
Hệ số tương quan có giá trị thuộc[−1;1], hay−1≤rXY≤1.
Giá trị âm=⇒mối liên hệ nghịch biến.
Giá trị dương=⇒mối liên hệ đồng biến.
Hệ số tương quan bằng 0=⇒không có mối liên hệ.
Khi|rXY| →1=⇒mối liên hệ càng mạnh.
Khi|rXY|=1=⇒mối quan hệ tuyến tính hoàn hảo.
VTLU KTL 61 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan III
Tính hệ số tương quan mẫu giữa GDP/người và Tự do kinh tế?
Câu hỏi:
Có mối quan hệ gì giữa GDP bình quân đầu người và Tự do kinh tế?
VTLU KTL 62 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan IV
Kiểm định tương quan tuyến tính giữa GDP/người và Tự do kinh tế?
Câu hỏi:
Ở mức 5%, có tương quan tuyến tính giữa GDP/người và Tự do kinh tế?
VTLU KTL 63 / 161
HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan V
Tính hệ số tương quan mẫu giữa % nghèo và % tốt nghiệp TH?
Câu hỏi:
Có mối quan hệ gì giữa Tỷ lệ nghèo và Tỷ lệ tốt nghiệp trung học?
VTLU KTL 64 / 161
NotesNotes

HIỆP PHƯƠNG SAI VÀ HỆ SỐ TƯƠNG QUAN Hệ số tương quan
Hệ số tương quan VI
Kiểm định tương quan tuyến tính giữa % nghèo và % TNTH?
Câu hỏi:
Ở mức 5%, có tương quan tuyến tính giữa % nghèo và % tốt nghiệp TH?
VTLU KTL 65 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
VTLU KTL 66 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
Ví dụ 4
Câu hỏi:
Đường nào sau đây là có
vẻ phù hợp nhất để mô
tả mối quan hệ tuyến
tính giữa % nghèo đói và
% tốt nghiệp trung học?
⇒Đường thẳng (a)80 85 90
6
8
10
12
14
16
18
% HS grad
% in poverty
(a)
(b)
(c)
(d)
VTLU KTL 67 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Mô hình hồi quy tuyến tính đơn biến
Mô hình hồi quy tổng thể
VTLU KTL 68 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Mô hình hồi quy tuyến tính đơn biến
Mô hình hồi quy tổng thể
Phương trình hồi quytuyến tính đơn biến tổng thểcó dạng:
Y=β1+β2X+ε
trong đó
β1, β2làcác tham số chưa biết nhưng là hằng số, với:
β1là tham số tự do (tham số chặn),
β2là tham số góc
εlà sai số ngẫu nhiên,có trung bình bằng 0 và phương saiσ
2
E(Y|Xi)làgiá trị trung bìnhcủaYtại giá trịXicho trước.
Yilà các giá trị cụ thể (giá trị cá biệt).
VTLU KTL 69 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Mô hình hồi quy tuyến tính đơn biến
Mô hình hồi quy mẫu
VTLU KTL 70 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Mô hình hồi quy tuyến tính đơn biến
Mô hình hồi quy mẫu
Hàm hồi quy mẫu
b
Y=ˆβ1+ˆβ2X
trong đó,
ˆYilà ước lượng củaE(Y|Xi)
ˆ
β1,
ˆ
β2là các ước lượng củaβ1, β2
VTLU KTL 71 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Phần dư
Phần dư là gì?
Phần dư (sai số ước lượng)là sai số có được từ mô hình ước lượng:
Dữ liệu=Ước lượng+Phần dư80 85 90
6
8
10
12
14
16
18
% HS grad
% in poverty
VTLU KTL 72 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Phần dư
Cách tìm phần dư
Phần dưlàkhác biệtgiữa giá trị quan sát (yi) và giá trị dự báoˆyi, hay:
ei=Yi−ˆYi80 85 90
6
8
10
12
14
16
18
% HS grad
% in poverty
y
5.44
y
^
y
−4.16
y
^
DC
RI
% sống trong cảnh nghèo
đói ở DCcao hơn5.44%
so với dự đoán.
% sống trong cảnh nghèo
đói ở RIthấp hơn4.16%
so với dự đoán.
VTLU KTL 73 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Phần dư
Phân biệt sai số ngẫu nhiên và phần dư
Có hai cách biểu diễn choYi:
1
Yi=E(Y|XI) +εi=β1+β2Xi+εi
2
Yi=ˆYi+ei=
ˆ
β1+
ˆ
β2Xi+ei
VTLU KTL 74 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Hồi quy bình phương tối thiểu
Vớiquan sát đầu tiên:phần dưe1=Y1−ˆY1; vớiquan sát thứ hai:
phần dưe2=Y2−ˆY2, ...
Một cách tổng quát,phần dư của quan sát thứi:
ei=Yi−ˆYi=Yi−ˆβ1−ˆβ2Xi
Tổng của bình phương phần dư(Sum Square of Residuals):
e
2
1+e
2
2+. . .+e
2
n=
n
X
i=1
e
2
i=
n
X
i=1
(Yi−ˆβ1−ˆβ2Xi)
2
=RSS
⇒Đây là một hàm số theo 2 biếnˆβ1vàˆβ2, ký hiệu:f(ˆβ1,ˆβ2).
VTLU KTL 75 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Hồi quy bình phương tối thiểu
Phương pháp bình phương tối thiểu (OLS)sẽchọn đường thẳng
với hệ số chặnˆβ1và hệ số gócˆβ2cótổng của bình phương các
phần dư đạt giá trị nhỏ nhất.
Hayphương pháp OLS nhằm xác định
ˆ
β1và
ˆ
β2sao cho:f(ˆβ1,ˆβ2) =
n
X
i=1
e
2
i=
n
X
i=1
(Yi−ˆβ1−ˆβ2Xi)
2
→min
⇒Đây là bài toántìm cực trịcủahàm sốftheo2biến(
ˆ
β1,
ˆ
β2).
VTLU KTL 76 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Hồi quy bình phương tối thiểu
Các bước cơ bản để giải bài toán nàylà:
Lấy các đạo hàm riêngcủaf(
ˆ
β1,
ˆ
β2)lần lượt theo
ˆ
β1và
ˆ
β2.
Cho hai đạo hàm riêng bằng 0, ta có hệ phương trình:
∂f

ˆ
β1
=0
∂f

ˆ
β2
=0
⇒Đây làmột hệ gồm2phương trình theo2ẩn.
Giải hệ phương trìnhtrên để tìm các nghiệm tối ưu của
ˆ
β1và
ˆ
β2.
VTLU KTL 77 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Đạo hàm riêng theoˆβ1
∂S
∂ˆβ1
=

∂ˆβ1
n
X
i=1
(Yi−
ˆ
β1−
ˆ
β2Xi)
2
=
n
X
i=1


ˆ
β1
(Yi−
ˆ
β1−
ˆ
β2Xi)
2
=
n
X
i=1
2(Yi−
ˆ
β1−
ˆ
β2Xi)(−1)
=−2

n
X
i=1
Yi−nˆβ1−ˆβ2
n
X
i=1
Xi
!
=0
VTLU KTL 78 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Đạo hàm riêng theoˆβ2
∂S

ˆ
β2
=


ˆ
β2
n
X
i=1
(Yi−
ˆ
β1−
ˆ
β2Xi)
2
=
n
X
i=1


ˆ
β2
(Yi−ˆβ1−ˆβ2Xi)
2
=
n
X
i=1
2(Yi−ˆβ1−ˆβ2Xi)(−Xi)
=−2
n
X
i=1
(XiYi−
ˆ
β1Xi−
ˆ
β2X
2
i)
=−2

n
X
i=1
XiYi−
ˆ
β1
n
X
i=1
Xi−
ˆ
β2
n
X
i=1
X
2
i
!
=0
VTLU KTL 79 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Hệ gồm2phương trình theo2ẩn
Các hệ số ước lượngˆβ1,ˆβ2là nghiệm của hệ:
−2

n
X
i=1
Yi−nˆβ1−ˆβ2
n
X
i=1
Xi
!
=0
−2

n
X
i=1
XiYi−ˆβ1
n
X
i=1
Xi−ˆβ2
n
X
i=1
X
2
i
!
=0
VTLU KTL 80 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Giải hệ phương trình I
Chia 2 vế cho -2 và chuyển vế
ˆβ1n +ˆβ2
P
n
i=1
Xi=
P
n
i=1
Yi (1)
ˆβ1
P
n
i=1
Xi+ˆβ2
P
n
i=1
X
2
i
=
P
n
i=1
XiYi (2)
Nhận xét:
Đây là một hệ gồm2phương trìnhtuyến tínhtheo2ẩn.
Tất cả các giá trịXivàYilà các hằng số.
VTLU KTL 81 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Giải hệ phương trình II
Chia 2 vế của (1) chonvà thayˆβ1vào (2)
ˆβ1 +ˆβ2X =Y (3)
ˆβ1
P
n
i=1
Xi+ˆβ2
P
n
i=1
X
2
i
=
P
n
i=1
XiYi (2)
Từ (3) suy ra
ˆ
β1và thay vào (2)
ˆ
β1 =Y−
ˆ
β2X (4)
(Y−
ˆ
β2X).
P
n
i=1
Xi+
ˆ
β2
P
n
i=1
X
2
i
=
P
n
i=1
XiYi (5)
VTLU KTL 82 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Giải hệ phương trình III
Trong (5) thay
P
n
i=1
Xi=n.X
ˆβ1 =Y−
ˆ
β2X (4)
(Y−
ˆ
β2X).n.X+
ˆ
β2
P
n
i=1
X
2
i
=
P
n
i=1
XiYi (6)
Thực hiện biến đổi và chuyển vế trong (6)
ˆβ1 =Y−ˆβ2X (4)
ˆβ2
P
n
i=1
X
2
i
−ˆβ2.n.X
2
=
P
n
i=1
XiYi−n.X.Y (7)
VTLU KTL 83 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Công thức tính các hệ số ước lượng
Các hệ sốˆβ1vàˆβ2được cho bởi công thức:
ˆβ1=Y−ˆβ2X
ˆβ2=
P
n
i=1
XiYi−n.X.Y
P
n
i=1
X
2
i
−n.X
2
=
SXY
SXX
VTLU KTL 84 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Công thức tính các hệ số ước lượng
Nghiệm tối ưucủa bài toán trên được tính theo công thức:
Hệ số góc
ˆβ2=
P
n
i=1
(Xi−¯X)(Yi−¯Y)
P
n
i=1
(Xi−¯X)
2
=
P
Xi.Yi−n.X.Y
P
X
2
i
−n.X
2
=
SXY
SXX
Hệ số chặn
ˆ
β1=¯Y−
ˆ
β2
¯X
VTLU KTL 85 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ý nghĩa của hệ số góc
Hệ số góc
ˆ
β2biểu thịđộ dốc của đường hồi quy.
Nếu X thay đổi một lượng∆X, thì giá trị dự báo củaYsẽthay đổi
một lượng∆Y=ˆβ2∆X.
Ý nghĩa:
Khi X tăng thêm một đơn vị, giá trị dự báo củaYsẽtăng
thêm/giảm điˆβ2đơn vị.
⇒Hệ số gócˆβ2làlượng thay đổi của E(Y)khiXtăng thêm 1 đơn vị.
VTLU KTL 86 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ý nghĩa của hệ số chặn
Hệ số chặnˆβ1là giao
điểm của đường thẳng
với trụcOy.
Ý nghĩa
Khi X=0, giá trị dự báo
của Ybằng
ˆ
β1.
⇒Hệ số
ˆ
β1là trung bình
củaYkhiX=0,.
VTLU KTL 87 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Các tính chất của ước lượng OLS
Nhận xét
Vớimột mẫugồmncặp quan sát(Xi,Yi),các hệ sốˆβ1vàˆβ2 làduy
nhất.
Trên toàn bộ tổng thể,các hệ sốˆβ1vàˆβ2làcác đại lượng ngẫu
nhiênvàlà ước lượng điểm củaβ1, β2.
VTLU KTL 88 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 I
Dữ liệu vềsố con (X)vàsố giờ làm việc việc nhà (Y) mỗi tuần
của người chồngở các hộ gia đình mà cả 2 vợ chồng đều đi làm.
Gia đình Số con
Số giờ/tuần
làm việc nhà của người chồng
A 1 1
B 1 2
C 1 3
D 1 5
E 2 3
F 2 1
G 3 5
H 3 0
I 4 6
J 4 3
K 5 7
L 5 4
VTLU KTL 89 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 II
Tóm tắt thống kê cả bộ dữ liệu
sum
VTLU KTL 90 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 III
Tóm tắt thống kê của biến phụ thuộc
sum y, det
VTLU KTL 91 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 IV
Quan sát hình dáng phân phối của biến phụ thuộc
graph box y
VTLU KTL 92 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 V
Quan sát hình dáng phân phối của biến phụ thuộc
graph hbox y
VTLU KTL 93 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 VI
Trực quan mối liên hệ giữa 2 biến trong bộ dữ liệu
graph twoway (scatter y x)
VTLU KTL 94 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 VII
Tính hệ số tương quan
corr y x
⇒Hệ số tương quan giữa Y và X là:rYX=0.499
VTLU KTL 95 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 VIII
Kiểm định hệ số tương quan
pwcorr y x, star(0.1)

Ở mức ý nghĩa 10%, hệ số tương quan có ý nghĩa thống kê (nghĩa
là hệ số tương quan thực sự khác 0 ở mức 10%)
⇒Ở mức 10%, có tương quan giữa Y và X.
VTLU KTL 96 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 IX
Tìm các hệ số ước lượng: Thủ công
Bước 1. Lập bảng
X X −¯X Y Y −¯Y(X−¯X)(Y−¯Y) (X−¯X)
2
1 -1.67 1 -2.33 3.89 2.79
1 -1.67 2 -1.33 2.22 2.79
1 -1.67 3 -0.33 0.55 2.79
1 -1.67 5 1.67 -2.79 2.79
2 -0.67 3 -0.33 0.22 0.45
2 -0.67 1 -2.33 1.56 0.45
3 0.33 5 1.67 0.55 0.11
3 0.33 0 -3.33 -1.10 0.11
4 1.33 6 2.67 3.55 1.77
4 1.33 3 -0.33 -0.44 1.77
5 2.33 7 3.67 8.55 5.43
5 2.33 4 0.67 1.56 5.43
32 40 18.32 26.68
Với:¯X=
32
12
=2.67 ¯Y=
40
12
=3.33
VTLU KTL 97 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 X
Tìm các hệ số ước lượng: Thủ công
Bước 2. Tính giá trị của các hệ số:
Hệ số góc

ˆ
β2

ˆβ2=
P
(X−¯X)(Y−¯Y)
P
(X−¯X)
2
=
18.32
26.68
=0.69
Hệ số chặn

ˆβ1

ˆβ1=¯Y−ˆβ2
¯X=3.33−(0.69)(2.67) =1.49
VTLU KTL 98 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XI
Tìm các hệ số ước lượng: Với Stata
regress y x
VTLU KTL 99 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XII
Phương trình hồi quy mẫu vớiˆβ1=1.49vàˆβ2=0.69
ˆY=
ˆ
β1+
ˆ
β2X=1.49+0.69X
ˆβ2=0.69:
Trong một hộ gia đình mà cả 2 vợ chồng đều đi làm việc, khi có thêm 1
đứa con thì trung bình mỗi tuần, thời gian làm việc nhà của người
chồng tăng thêm 0.69 giờ (khoảng 36 phút).
ˆβ1=1.49:
Trong một hộ gia đình mà cả 2 vợ chồng đều đi làm việc, khi không có
đứa con nào, trung bình mỗi tuần, người chồng làm việc nhà 1.49 giờ.
VTLU KTL 100 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XIII
Trực quan các hệ số ước lượng
VTLU KTL 101 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XIV
Lưu và xuất kết quả ước lượng I
* Ước lượng mô hình
. reg y x
* Lưu mô hình
. estimates store mh1
* Xuất kết quả
. estimates table mh1
VTLU KTL 102 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XV
Xuất kết quả ước lượng sang dạng .xls
* Ước lượng mô hình
. reg y x
* Cách 1
. outreg2 using mh1.xls, replace
* Cách 2 (bổ sung thêm một số tùy chọn)
. outreg2 using mh1.xls, bdec(3) ctitle("Nncome=f(educ)") se title("Dự báo
cho thu nhập") replace
VTLU KTL 103 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Ước lượng các tham số hồi quy
Ví dụ 5 XVI
Xuất kết quả ước lượng sang dạng .doc
* Ước lượng mô hình
. reg y x
* Cách 1
. outreg2 using mh1.doc, replace
* Cách 2 (bổ sung thêm một số tùy chọn)
. outreg2 using mh1.doc, bdec(3) ctitle("Nncome=f(educ)") se title("Dự
báo cho thu nhập") replace
VTLU KTL 104 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Các thước đo mức độ phù hợp của mô hình
2 thước đo tiêu chuẩn để đánh giá độ phù hợp của mô hình là:
1
Sai số chuẩn của hồi quy(Standard Error of the Regression):
Ký hiệu là:ˆσ
Đây cũng làđộ lệch chuẩn của phần dư,
Phản ánhmức độ chênh lệch trung bìnhgiữagiá trị dự báo(fitted
values) vàgiá trị thực tếcủa biến phụ thuộcY.
2
Hệ số xác định(R-squared):
Ký hiệu:R
2
Đo lườngphần biến thiêncủaYquanhgiá trị trung bình mẫu¯Yđược
giải thích bởi các biến giải thích trong mô hình.
VTLU KTL 105 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Sai số chuẩn của hồi quy I
Công thức:
ˆσ=
s
P
n
i=1
(yi−ˆyi)
2
n−2
=
s
P
n
i=1
e
2
i
n−2
=
s
RSS
n−2
Trong đó:
yilà giá trị thực tế,
ˆyilà giá trị dự báo từ mô hình,
nlà số lượng quan sát.
VTLU KTL 106 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Sai số chuẩn của hồi quy II
Ý nghĩa:
ˆσ
còn được gọi làcăn bậc hai của trung bình bình phương sai số(root
mean squared error - RMSE).
Cho biết các giá trị dự báoˆYigần với giá trị thực tếYinhư thế nào.
ˆσcàng nhỏ⇒các giá trị dự báo càng gần với thực tế.
Có cùng đơn vị với dữ liệu.
Lưu ý:ˆσ
2
gần giống trung bình mẫu của bình phương phần dư, chỉ khác ở mẫu số
làn−2thay vìn−1.
VTLU KTL 107 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Sai số chuẩn của hồi quy II
Ý nghĩa:
ˆσ
còn được gọi làcăn bậc hai của trung bình bình phương sai số(root
mean squared error - RMSE).
Cho biết các giá trị dự báoˆYigần với giá trị thực tếYinhư thế nào.
ˆσcàng nhỏ⇒các giá trị dự báo càng gần với thực tế.
Có cùng đơn vị với dữ liệu.
Lưu ý:ˆσ
2
gần giống trung bình mẫu của bình phương phần dư, chỉ khác ở mẫu số
làn−2thay vìn−1.
VTLU KTL 107 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Hệ số xác địnhR
2
I
VTLU KTL 108 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Hệ số xác địnhR
2
II
Tổng bình phương của tất cả các sai lệch:
TSS=
n
X
i=1
(Yi−Y)
2
=SYY= (n−1)S
2
Y
Tổng bình phương của phần sai lệch được giải thích bởi mô hình
ESS=
n
X
i=1
(ˆYi−Y)
2
=ˆβ2
2
×SXX=ˆβ2
2
(n−1)S
2
X
Tổng bình phương phần dư:
RSS=
n
X
i=1
e
2
i
VTLU KTL 109 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Hệ số xác địnhR
2
III
Mối liên hệ:
TSS=RSS+ESS
Hệ số xác định:
R
2
=
ESS
TSS
=1−
RSS
TSS
Hay:
R
2
=r
2
XY
vớirXYlà hệ số tương quan mẫu,
Suy ra:
R
2
=
ˆ
β
2

S
2
X
S
2
YvớiS
2
X
là phương sai mẫu củaX;S
2
Y
là phương sai mẫu củaY
VTLU KTL 110 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Ý nghĩa củaR
2
I
0≤R
2
≤1.
NếuR
2
=0⇒không tồn tại mối quan hệ tuyến tính giữaYvàX
⇒mọi giá trị dự báoˆYiđều bằng trung bình mẫu¯Y.
NếuR
2
=1⇒mô hình khớp hoàn toàn dữ liệu
⇒mọi giá trị dự báoˆYitrùng với giá trị thựcYi.
R
2
bằng bình phương hệ số tương quan giữaXvàY:R
2
=r
2
XY
.
R
2
cũng là bình phương hệ số tương quan giữaYvàˆY.
VTLU KTL 111 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Ý nghĩa củaR
2
II
Hệ sốR
2
thường được sử dụng đểđánh giá độ mạnh của sự phù
hợpcủa mô hình tuyến tính.
R
2
cho biếtphần trăm trong tổng biến thiên của biến phụ thuộc
Yđược giải thích bởi mô hình.
VTLU KTL 112 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Tính hệR
2
với Stata
Hệ số xác định bằng bao nhiêu? Ý nghĩa của nó?
VTLU KTL 113 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Ví dụ 6
Câu nào sau đây là giải thích đúng ý nghĩa củaR
2
=0.56?
(a)
Mô hình này giải thích được 56% cho sự
biến thiên trong % sinh viên tốt nghiệp
HG giữa 51 tiểu bang.
(b)
Mô hình này giải thích được 56% cho sự
biến thiên trong % cư dân sống trong
cảnh nghèo đói ở 51 tiểu bang.
(c)
56% học sinh tốt nghiệp trung học dự
đoán đúng về cuộc sống nghèo đói.
(d)
Mô hình này giải thích được 75% cho sự
biến thiên trong % cư dân sống trong
cảnh nghèo đói ở 51 tiểu bang.
VTLU KTL 114 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Ví dụ 6
Câu nào sau đây là giải thích đúng ý nghĩa củaR
2
=0.56?
(a)
Mô hình này giải thích được 56% cho sự
biến thiên trong % sinh viên tốt nghiệp
HG giữa 51 tiểu bang.
(b)
Mô hình này giải thích được 56%
cho sự biến thiên trong % cư dân
sống trong cảnh nghèo đói ở 51 tiểu
bang.
(c)
56% học sinh tốt nghiệp trung học dự
đoán đúng về cuộc sống nghèo đói.
(d)
Mô hình này giải thích được 75% cho sự
biến thiên trong % cư dân sống trong
cảnh nghèo đói ở 51 tiểu bang.
VTLU KTL 114 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Kiểm định sự phù hợp của mô hình
1.
(
H0:R
2
=0
H1:R
2
̸=0
2.
Fstat=
ESS/(k−1)
RSS/(n−k)
=
R
2
/(k−1)
(1−R
2
)/(n−k)
Vớiklà số tham số cần ước lượng trong mô hình.
3.
Bác bỏH0nếuFstat>Fα;k−1;n−khoặcp−value< α.
⇒Hàm hồi quy phù hợp ở mức ý nghĩaα%.
⇒Có sự phụ thuộc củaYvào sự thay đổi củaXở mứcα%.
VTLU KTL 115 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Đánh giá sự phù hợp của mô hình
Ví dụ 7
Ở mức 10%, mô hình sau có phù hợp không?
1.





H0:R
2
=0
H1:R
2
̸=0
α= 0.1
2. Fstat=3.31
3.
Giá trị tới hạn:F0.1;1;10=3.285
VìFstat>F0.1;1;10⇒Bác bỏH0⇒Ở mức 10%, mô hình phù hợp.
VTLU KTL 116 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Các giả định cơ bản
1
Kỳ vọng của các sai số ngẫu nhiênbằng 0:E(ε|Xi) =0,∀i
2
Phương sai của sai số ngẫu nhiên làhằng số:
Var(ε|Xi) =Var(ε|Xj) =σ
2
3
Không có tương quangiữa các sai số ngẫu nhiên:
Cov(εi, εj) =0,∀i̸=j
4
Không có tương quangiữaεivàX:Cov(εi,X) =0
5
εituân theo phân phối chuẩn:εi∼N(0, σ
2
),∀i
VTLU KTL 117 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Định lý Gauss-Markov
Định lý
Nếu mô hình hồi quy tuyến tính
bình phương tối thiểu thông thường (OLS):
1
Không chệch
2
Có phương sai nhỏ nhất (tốt nhất)trong tất cả các ước lượng
tuyến tính không chệch có thể có.
⇒Khi đó, các hệ số ước lượng được gọi làBLUEs (Best Linear
Unbiased Estimators).
VTLU KTL 118 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Bản chất thống kê của các ước lượng I
1.
E(ˆβi) =βi,i=1,2
2.
ˆ
β2
Var(ˆβ2) =
σ
2
SXX
;Se(ˆβ2) =
σ

SXX
3.
ˆ
β1
Var(ˆβ1) =
P
n
i=1
X
2
i
n
σ
2
SXX
;Se(ˆβ1) =
s
P
n
i=1
X
2
i
n
σ

SXX
VTLU KTL 119 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Bản chất thống kê của các ước lượng II
4.
ˆβ1∼N

β1;Se
2
(ˆβ1)

, ˆβ2∼N

β2;Se
2
(ˆβ2)

trong đó,
Se(
ˆ
β1) =
s
P
n
i=1
X
2
i
n
×
σ

SXX
;Se(
ˆ
β2) =
σ

SXX
VTLU KTL 120 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ước lượng điểm

E(ˆβ1) =β1
⇒Ước lượng điểm tốt nhất của tham số chặnβ1làˆβ1

E(ˆβ2) =β2
⇒Ước lượng điểm tốt nhất của tham số gócβ2làˆβ2
VTLU KTL 121 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ước lượng khoảng
Biến ngẫu nhiên chuẩn hóacủa các ước lượng:
ti=
ˆβi−βi
Se(ˆβi)
∼T(n−2)
Khoảng ước lượngvới độ tin cậy(1−α).100%:
βi∈ˆβi±t
n−2;
α
2
×Se(ˆβi)
VTLU KTL 122 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Kiểm định ý nghĩa thống kê
1.
(
H0:βi=0
H1:βi̸=0
2. t=
ˆβi
Se(ˆβi)
3.
MiềnH0đúng là(−tα
2
;n−k;tα
2
;n−k)
Nếu giá trị kiểm định thuộcmiềnH0đúngthì kết luậnhệ sốβi=0,
hay nói cách kháclà hệ sốβikhông có ý nghĩa thống kê.
Ngược lại, nếu giá trị kiểm định thuộcmiền bác bỏH0thì kết luận hệ
sốβicó ý nghĩa thống kê.
VTLU KTL 123 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Kiểm định 1 nhận định: kiểm định 2 phía
1.
(
H0:βi=β0
H1:βi̸=β0
2. t=
ˆβi−β0
Se(ˆβi)
3.
MiềnH0đúng là(−tα
2
;n−k;tα
2
;n−k)
Nếugiá trị kiểm định thuộc miềnH0đúng thì chấp nhậnH0và kết
luận hệ sốβibằng giá trịβ0cho trước.
Nếugiá trị kiểm định thuộc miền bác bỏH0thì kết luậnhệ sốβi
không bằng giá trịβ0cho trước.
VTLU KTL 124 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Kiểm định 1 nhận định: kiểm định đuôi trái
1.
(
H0:βi=β0
H1:βi< β0
2. t=
ˆβi−β0
Se(ˆβi)
3.
MiềnH0đúng là(−tα;n−k; +∞)
Nếugiá trị kiểm định thuộc miềnH0đúng thì chấp nhậnH0và kết
luận hệ sốβibằng giá trịβ0cho trước.
Nếugiá trị kiểm định thuộc miền bác bỏH0thì kết luậnhệ sốβi
nhỏ hơnβ0cho trước.
VTLU KTL 125 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Kiểm định 1 nhận định: kiểm định đuôi phải
1.
(
H0:βi=β0
H1:βi> β0
2. t=
ˆβi−β0
Se(
ˆ
βi)
3.
MiềnH0đúng là(−∞;tα;n−k)
Nếugiá trị kiểm định thuộc miềnH0đúng thì chấp nhậnH0và kết
luận hệ sốβibằng giá trịβ0cho trước.
Nếugiá trị kiểm định thuộc miền bác bỏH0thì kết luậnhệ sốβi
lớn hơnβ0cho trước.
VTLU KTL 126 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 I
Với độ tin cậy 95%, tìm khoảng ước lượng cho các tham số hồi quy?
Khoảng ước lượng ở độ tin cậy 95% củaβ1là:
β1∈(−0.154;1.529)
Khoảng ước lượng ở độ tin cậy 95% củaβ2là:
β2∈(−1.072;4.072)
VTLU KTL 127 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 II
Ở mức 5%, kiểm định ý nghĩa thống kê của tham sốβ1?
1.

H0:β1=0
H1:β1̸=0
2.
t=
ˆβ1−β0
Se(ˆβ1)
=
1.5
1.1542
=1.3
3.

Vớiα=0.05⇒t0.025;10 =2.228⇒MiềnH0đúng là(−2.228;2.228)
–Vì giá trị kiểm định thuộc miềnH0đúng⇒chấp nhậnH0
⇒hệ sốβ1=0(hay không có ý nghĩa thống kê) ở mức 5%.
VTLU KTL 128 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 III
Ở mức 5%, kiểm định ý nghĩa thống kê của tham sốβ2?
1.

H0:β2=0
H1:β2̸=0
2.
t=
ˆβ2−β0
Se(ˆβ2)
=
0.6875
0.3778
=1.82
3.

Vớiα=0.05⇒t0.025;10 =2.228⇒MiềnH0đúng là(−2.228;2.228)
–Vì giá trị kiểm định thuộc miềnH0đúng⇒chấp nhậnH0
⇒hệ sốβ2=0(hay không có ý nghĩa thống kê) ở mức 5%.
VTLU KTL 129 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 IV
Có ý kiến cho rằng: "Trong một hộ gia đình mà cả 2 vợ chồng đều đi làm, khi có thêm 1 đứa
con thì thời gian làm việc nhà trung bình của người chồng tăng thêm 36 phút/tuần". Ở mức
5%, ý kiến trên có đúng không?
1.
(
H0:β2=0.6
H1:β2̸=0.6
α=0.05
2.
t=
ˆβ2−β0
Se(
ˆ
β2)
=
0.6875−0.6
0.3778
=0.23
3.
–Vớiα=0.05⇒t0.025;10=2.228⇒MiềnH0đúng là(−2.228;2.228)
–Vì giá trị kiểm định thuộc miềnH0đúng⇒chấp nhậnH0
⇒hệ sốβ2=0.6(hay ý kiến trên là đúng) ở mức 5%.
VTLU KTL 130 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 V
Có ý kiến cho rằng: "Trong một hộ gia đình mà cả 2 vợ chồng đều đi làm, khi có thêm 1 đứa
con thì thời gian làm việc nhà trung bình của người chồng tăng thêm nhiều hơn 30 phút/tuần".
Ở mức 5%, ý kiến trên có đúng không?
1.
(
H0:β2=0.5
H1:β2>0.5
α=0.05
2.
t=
ˆβ2−β0
Se(
ˆ
β2)
=
0.6875−0.5
0.3778
=0.5
3.
–Vớiα=0.05⇒t0.05;10=1.812⇒MiềnH0đúng là(−∞;1.812)
–Vì giá trị kiểm định thuộc miềnH0đúng⇒chấp nhậnH0
⇒ở mức 5%, hệ sốβ2=0.5(hay ý kiến trên là sai).
VTLU KTL 131 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Suy diễn thống kê cho các tham số hồi quy
Ví dụ 8 VI
Có ý kiến cho rằng: "Trong một hộ gia đình mà cả 2 vợ chồng đều đi làm, khi có thêm 1 đứa
con thì thời gian làm việc nhà trung bình của người chồng tăng thêm ít hơn 48 phút/tuần". Ở
mức 5%, ý kiến trên có đúng không?
1.
(
H0:β2=0.5
H1:β2<0.8
α=0.05
2.
t=
ˆβ2−β0
Se(ˆβ2)
=
0.6875−0.8
0.3778
=−0.3
3.
–Vớiα=0.05⇒t0.05;10=1.812⇒MiềnH0đúng là(−1.812; +∞; )
–Vì giá trị kiểm định thuộc miềnH0đúng⇒chấp nhậnH0
⇒ở mức 5%, hệ sốβ2=0.8(hay ý kiến trên là sai).
VTLU KTL 132 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Các kiểm định chẩn đoán: sử dụng đồ thị phần dư
1. Kiểm tra giả định về tính tuyến tính
. lowess y x
Câu hỏi:
Tương quan giữa X và Y có thỏa giả định về tính tuyến tính không?
VTLU KTL 133 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Các kiểm định chẩn đoán: sử dụng đồ thị phần dư
2. Kiểm tra tính xấp xỉ phân phối chuẩn của phần dư
* Tạo biến phần dư
. regress y x
. predict phandu, resid
* Quan sát hình dáng phân phối
của phần dư
. histogram phandu, kdensity
* Kiểm định tính xấp xỉ pp chuẩn
của phần dư
. sktest phandu
VTLU KTL 134 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Các kiểm định chẩn đoán: sử dụng đồ thị phần dư
3. Kiểm tra tính đồng nhất phương sai của phần dư
. rvfplot
⇒Phần dư biến động ổn định
xung quanh trụcOx
⇒Đồ thị cho thấy X không phụ
thuộc vàoˆY
⇒Không có hiện tương phương
sai sai số thay đổiVTLU KTL 135 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Các kiểm định chẩn đoán: sử dụng đồ thị phần dư
4. Kiểm tra ảnh hưởng của giá trị ngoại lệ
. lvr2plot, mlabel(y)
Có 2 quan sátcó tính
đòn bẩy rất caovới Y
= 4 và Y = 7, ở góc trên
bên trái.
Có 1phần dư lớnvới
quan sát Y = 0, ở góc
dưới bên phải.
Không có điểm ngoại lệ
ảnh hưởngđến mô hình
VTLU KTL 136 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo điểm I
Biếthàm hồi quy mẫucó dạng:
ˆY=ˆβ1+ˆβ2×X
Giá trịdự báo điểmcủaYtạiX=X0được tính theo công thức:
ˆY0=ˆβ1+ˆβ2×X0
VTLU KTL 137 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo điểm II
Biết phương trình hồi quy mẫu:
b
Y
=1.49+0.69X. Tính giá trị dự báo
củaYtạiX=6?
ThayX=6 vào phương trình hồi quy mẫu, ta có:
b
Y=1.49+0.69X=1.49+0.69×6=5.63

Với những gia đình mà cả 2 vợ chồng đều đi làm, khi có 6 đứa con thì
thời gian người chồng làm việc nhà trung bình là 5.63 giờ/tuần.
VTLU KTL 138 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo điểm III
Biết phương trình hồi quy mẫu:
b
Y
=1.49+0.69X. Tính giá trị dự báo
củaYtạiX=7?
ThayX=7 vào phương trình hồi quy mẫu, ta có:
b
Y=1.49+0.69X=1.49+0.69×7=6.32

Với những gia đình mà cả 2 vợ chồng đều đi làm, khi có 7 đứa con thì
thời gian người chồng làm việc nhà trung bình là 6.32 giờ/tuần.
Nhận xét:
ˆ
β2(6.32−5.63=0.69)
VTLU KTL 139 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo điểm IV
Sử dụng Stata, tính giá trị dự báo củaYtạiX=6?
* Thêm quan sát X = 6 vào bộ dữ liệu
. edit
. set obs 13
. replace X=6 in 13
* Ước lượng lại mô hình
. reg y x
* Tính toán giá trị dự báo tại X = 6
. predict yhat1, xb
. list x y yhat1 in 13
+---------------+
| x y yhat1 |
|---------------|
13. | 6 . 5.625 |
+---------------+
VTLU KTL 140 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo khoảng cho trung bình
Dự báo điểmcủaYtạiX=X0là:
ˆY0=ˆβ1+ˆβ2×X0
Dự báo khoảng cho trung bình có điều kiện củaYtạiX=X0, với
độ tin cậy(1−α).100%được tính theo công thức:
E(Y|X0)∈

ˆY0±t
n−2;
α
2
×
v
u
u
t
σ
2
"
1
n
+
(X0−X)
2
SXX
#


VTLU KTL 141 / 161
HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Dự báo khoảng cho giá trị cá biệt
Dự báo khoảng cho giá trị cá biệt củaYtạiX=X0với độ tin cậy
(1−α).100%được tính theo công thức:
Y0∈

ˆY0±t
n−2;
α
2
×
v
u
u
t
σ
2
"
1+
1
n
+
(X0−X)
2
SXX
#


VTLU KTL 142 / 161
NotesNotes

HỒI QUY TUYẾN TÍNH ĐƠN BIẾN Dự báo
Đồ thị dự báo khoảng
. twoway (lfitci y x) (lfitci y x, stdf ciplot(rline)) (scatter y x)
VTLU KTL 143 / 161
QUY TRÌNH PHÂN TÍCH HỒI QUY
QUY TRÌNH PHÂN TÍCH HỒI QUY
VTLU KTL 144 / 161
NotesNotes

QUY TRÌNH PHÂN TÍCH HỒI QUY
Các bước thực hiện phân tích thống kê bằng hồi quy
1.Quan sát dữ liệu, mô tả tóm tắt dữ liệu.
2.Xem xét mối quan hệ giữa 2 biến theo đồ thị và hệ số tương quan.
3.Chạy mô hình hồi quy và diễn giải kết quả.
4.
Tiến hành các kiểm định về sự phù hợp của mô hình và ý nghĩa thống
kê của các hệ số.
5.Phân tích phần dư và tiến hành các kiểm định chẩn đoán.
6.Dự báo.
VTLU KTL 145 / 161
BÀI TẬP
BÀI TẬP
VTLU KTL 146 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 1 I
GọiYlà tiêu dùng (triệu đồng ),Xlà thu nhập (triệu đồng). Biếtn=20
và các giá trị thống kê như sau:
X
X=1345.8;
X
Y=1221.1;
X
X
2
=92520;
SXX=1961.1;SYY=1414.7;SXY=1658.2
1
Hãy tínhESS,RSS,R
2
, phương sai ước lượng của sai số ngẫu nhiên?
2
Kiểm định độ phù hợp của mô hình ở mức ý nghĩa 5%?
3
Với độ tin cậy 95%, tìm khoảng tin cậy của các tham số hồi quy?
4
Với mức ý nghĩa 5%, hãy kiểm định giả thuyếtβ2=0? Từ kết quả
nhận được, hãy nêu ý nghĩa về mặt kinh tế của kết luận?
5
Có ý kiến cho rằng"Khi thu nhập tăng lên 1 triệu đồng thì lượng
chi tiêu tăng thêm nhiều hơn 800 ngàn". Ở mức ý nghĩa 5%, dựa
vào mô hình ước lượng, nhận định trên có đúng không?
VTLU KTL 147 / 161
BÀI TẬP Bài tập tính toán
Bài tập 1 II
1. Hãy tínhESS,RSS,R
2
, phương sai ước lượng của sai số ngẫu nhiên?
Giải
Ta có:
ESS=
n
X
i=1
(ˆYi−Y)
2
=ˆβ2
2
×SXX=ˆβ2
2
(n−1)S
2
X
Hệ số góc ước lượngˆβ2là:ˆβ2=
SXY
SXX
=
1658.2
1961.1
=0.8455
⇒ESS=ˆβ
2
2
×SXX=0.8455
2
×1961.1=1402.084
VTLU KTL 148 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 1 III
1. Hãy tínhESS,RSS,R
2
, phương sai ước lượng của sai số ngẫu nhiên?
Giải
Ta lại có:
TSS=
n
X
i=1
(Yi−Y)
2
=SYY= (n−1)S
2
Y
⇒TSS=SYY=1414.7
⇒RSS=TSS−ESS=1414.7−1402.084=12.616
⇒Hệ số xác định:R
2
=
ESS
TSS
=
1402.084
1414.7
=0.9911
VTLU KTL 149 / 161
BÀI TẬP Bài tập tính toán
Bài tập 1 IV
1. Hãy tínhESS,RSS,R
2
, phương sai ước lượng của sai số ngẫu nhiên?
Giải
Ta cũng có:
ˆσ
2
=
RSS
n−k
⇒Phương sai của phần dư (phương sai của hồi quy mẫu):
ˆσ
2
=
RSS
n−k
=
12.616
20−2
=
12.616
18
=0.7009
VTLU KTL 150 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 1 V
2. Kiểm định độ phù hợp của mô hình ở mức ý nghĩa 5%?
Giải
1.





H0:R
2
=0
H1:R
2
̸=0
α=0.05
2.
Fstat=
R
2
/(k−1)
(1−R
2
)/(n−k)
=
0.9911/(2−1)
(1−0.9911)/(20−2)
=2004.5
3. Vớiα=0.05⇒F0.05;1;18=4.414.
VìFstat>F0.05;1;18⇒Hàm hồi quy phù hợp ở mức ý nghĩa 5%.
VTLU KTL 151 / 161
BÀI TẬP Bài tập tính toán
Bài tập 1 VI
3. Với độ tin cậy 95%, tìm khoảng tin cậy của các tham số hồi quy?
Giải
βi∈ˆβi±t
n−2;
α
2
×Se(ˆβi)
vớiSe(ˆβ1) =
r
P
n
i=1
X
2
i
n
×
σ

SXX
Ta có:
•Hệ số chặn:ˆβ1=Y−ˆβ2X=
1221.1
20
−0.8455×
1345.8
20
=4.16
•Se(ˆβ1) =
r
P
n
i=1
X
2
i
n
×
ˆσ

SXX
=
s
92520
20
×
0.8371

1961.1
=1.2857.
•Giá trị tới hạn:t0.025;18=2.1
⇒β1∈4.16±2.1×1.2857= (1.46;6.85)
VTLU KTL 152 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 1 VII
3. Với độ tin cậy 95%, tìm khoảng tin cậy của các tham số hồi quy?
Giải
βi∈ˆβi±t
n−2;
α
2
×Se(ˆβi)
vớiSe(ˆβ2) =
σ

SXX
Ta có:
•Hệ số góc:ˆβ2=
SXY
SXX
=
1658.2
1961.1
=0.8455
•Se(ˆβ2) =
ˆσ

SXX
=
0.8371

1961.1
=0.0189.
•Giá trị tới hạn:t0.025;19=2.1
⇒β2∈0.8455±2.1×0.0189= (0.806;0.885)
VTLU KTL 153 / 161
BÀI TẬP Bài tập tính toán
Bài tập 2
Một đại lý nghiên cứu mối quan hệ giữa lượng bình gas bán được (Q: bình)
với giá một bình gas (PG: nghìn đồng) với 27 tháng từ tháng 1/ 1997 đến
3/1999 như sau:
b
Q=2590.3 −7.1461×PG
(384.9544) (0.12875)
R
2
=0.95195;RSS=225165;
Q=1831.41;Fstat=495.29
Lưu ý:Trong dấu ngoặc là sai số chuẩn(se)
VTLU KTL 154 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 2
Vớiα=5%, hãy:
1
Viết hàm hồi quy mẫu. Các hệ số thu được từ hàm hồi quy mẫu có
phù hợp lý thuyết kinh tế không?
2
Hàm hồi quy có phù hợp không?
3
Tìm ước lượng điểm cho phương sai của sai số ngẫu nhiên?
4
Tổng bình phương phần dưRSS,TSS,ESSbằng bao nhiêu?
5
Các hệ số của mô hình có ý nghĩa thống kê không?
6
Tìm khoảng tin cậy của tham số chặn và tham số độ dốc của mô hình?
7
Có thể nói khi giá gas tăng 1 nghìn thì lượng bán giảm bằng 10 bình
được không?
VTLU KTL 155 / 161
BÀI TẬP Bài tập tính toán
Bài tập 2
8
Giá gas giảm 1 nghìn thì lượng bán tăng nhiều hơn 7 bình, điều đó có
đúng không?
9
Tìm ước lượng điểm cho lượng bình gas bán ra khi giá là 105 nghìn
đồng/bình?
10
Tìm ước lượng khoảng cho lượng bán trung bình và cá biệt khi giá gas
là 105 nghìn đồng?
VTLU KTL 156 / 161
NotesNotes

BÀI TẬP Bài tập tính toán
Bài tập 3 I
Sử dụng bộ dữ liệu về tỷ lệ tử vong (số người chết/100.000 dân) và trình
độ học vấn (số năm đi học trung bình) ở 58 thành phố của Hoa Kỳ. Kết
quả hồi quy Tỷ lệ tử vong theo trình độ học vấn như sau:
VTLU KTL 157 / 161
BÀI TẬP Bài tập tính toán
Bài tập 3 II
Viết lại phương trình hồi quy mẫu? Giải thích ý nghĩa kinh tế của các
hệ số hồi quy?
Tìm hệ số xác địnhR
2
. Phát biểu ý nghĩa của hệ sốR
2
. Ở mức 5%,
mô hình có phù hợp không?
Tìm khoảng tin cậy 99% cho tham sốβ1?
Ở mức 5%, trình độ học vấn có ảnh hưởng đến tỷ lệ tử vong không?
Ở mức 5%, có thể cho rằng: “khi số năm đi học trung bình tăng thêm
1 năm thì số người chết/100000 dân giảm đi 50 người” không?
VTLU KTL 158 / 161
NotesNotes

BÀI TẬP Bài tập thực hành
Bài tập 1
Sử dụng bộ dữliệu GSS2021.dtavới 2 biến quan tâm là:
Biến phụ thuộc: Respondent’s income (conrinc).
Biến độc lập: Years of schooling (educ).
Câu hỏi
1.Quan sát dữ liệu?
2.Vẽ đồ thị mô tả mối quan hệ giữa 2 biến?
3.Tính và kiểm định hệ số tương quan giữa 2 biến?
4.Ước lượng mô hình:Income = F(Education)?
5.Viết mô hình hồi quy mẫu?
6.Vẽ các đồ thị phân tích phần dư?
7.Dự báo cho income của một người có educ = ?
VTLU KTL 159 / 161
BÀI TẬP Bài tập thực hành
Bài tập 2 I
Giới thiệu
Nhà đầu tư bất động sản, người mua nhà, và chủ nhà thường sử dụng giá
trị thẩm định của một bất động sản để dự đoán giá bán của nó.
Dữ liệu TAMPALMS về giá bán và tổng giá trị thẩm định của 92 bất động
sản nhà ở được bán vào năm 1999 trong một khu dân cư cao cấp tại
Tampa.
File này chứa hai cột dữ liệu:
C1- Giá trị thẩm định
C2- Giá bán
VTLU KTL 160 / 161
NotesNotes

BÀI TẬP Bài tập thực hành
Bài tập 2 II
Các yêu câu
1
Đề xuất một mô hình đường thẳng để liên hệ giá trị thẩm địnhXvới
giá bánY.
2
Xây dựng biểu đồ phân tán các biến, bao gồm đường hồi quy tốt nhất,
và giải thích mô hình này.
3
Đánh giá tính hữu dụng của mô hình bằng cách kiểm tra giả thuyết về
hệ số dốc [sử dụngα=0.05], và giải thíchR
2
. Rút ra kết luận phù
hợp.
4
Nếu mô hình đạt yêu cầu, chọn một giá trị thẩm định và ước lượng giá
bán sử dụng phương trình dự đoán của bạn. Báo cáo khoảng ước
lượng dự đoán 95% cho giá trị này và giải thích kết quả.
5
Xác định phạm vi giá trị thẩm định mà mô hình dự đoán có thể được
sử dụng.
VTLU KTL 161 / 161
NotesNotes
Tags