Upload
anaya
View
159
Download
12
Embed Size (px)
DESCRIPTION
CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH. CHƯƠNG 9. CHỌN MÔ HÌNH. Biết c ách tiếp cận để lựa chọn mô hình Biết cách k iểm định việc chọn mô hình. MỤC TIÊU. NỘI DUNG. Chọn mô hình- Các sai lầm khi chọn mô hình. 1. 2. Cách tiếp cận để l ự a chọn mô hình. 3. Kiểm định việc chọn mô hình. - PowerPoint PPT Presentation
Citation preview
CHƯƠNG 9CHƯƠNG 9
CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNHMÔ HÌNH
2
1. Biết cách tiếp cận để lựa chọn mô hình
2. Biết cách kiểm định việc chọn mô hình
MỤC TIÊU
CHỌN MÔ HÌNH
NỘI DUNG
3
Chọn mô hình- Các sai lầm khi chọn mô hình1
2
3
4
Kiểm định việc chọn mô hình
Cách tiếp cận để lựa chọn mô hình
4
1. Chọn mô hình- Tiết kiệm: Mô hình đơn giản nhưng phải chứa các biến chủ yếu ảnh hưởng đến biến phụ thuộc nhằm giải thích bản chất của vấn đề nghiên cứu.- Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất.-Tính thích hợp (R2): Mô hình có R2 ( hoặc càng gần 1 được coi càng thích hợp.- Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng.- Khả năng dự báo cao
Chọn mô hình và kiểm định chọn mô hình
2R
5
•Bỏ sót biến thích hợp: dẫn đến một số hậu quả nhưi.Các tham số ước lượng sẽ bị chệch và không vững.ii.Khoảng tin cậy và các kiểm định không chính xác.iii.Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
2. Các sai lầm khi chọn mô hình- Hậu quả
6
•Đưa vào mô hình những biến không phù hợp: các ước lượng thu được từ mô hình thừa biến không hiệu quả, khoảng tin cậy rộng.
2. Các sai lầm khi chọn mô hình- Hậu quả
7
•Lựa chọn mô hình không chính xác:i.Ước lượng chệch các hệ số hồi quy, thậm chí dấu của hệ số hồi quy có thể sai.ii.Có ít hệ số hồi quy ước lượng được có ý nghĩa thống kêiii.R2 không caoiv.Phần dư các quan sát lớn và biểu thị sự biến thiên có tính hệ thống.
2. Các sai lầm khi chọn mô hình- Hậu quả
Ví dụ• Về hàm chi phí của doanh nghiệp, dạng hàm
đúng Yi = b1 + b2Xi + b3Xi
2 + b4Xi3 + u1i
• Bỏ sót biến quan trọng (Xi3): Yi = a1 + a2Xi + a3Xi
2 + u2i
• Đưa biến không liên quan vào mô hình (Xi4):Yi = l1 + l2Xi + l3Xi
2 + l4Xi3 + l5Xi
4 + u3i
• Dạng hàm sai. lnY = g1 + g2Xi + g3Xi
2 + g4Xi3 + u4i
8
9
Cách tiếp cận để lưa chọn mô hình1. Xác định số biến độc lập: có hai hướng tiếp cận:Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ
vào mô hìnhTừ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy
đủ các biến độc lập đã được xác định, sau đó loại trừ những biến không quan trọng ra khỏi mô hình
2. Kiểm định mô hình có vi phạm giả thiết như đa cộng tuyến, phương sai thay đổi, tự tương quan. Nếu mô hình vi phạm thì cần có biện pháp khắc phục.
3. Chọn dạng hàm; dựa vàoCác lý thuyết kinh tếCác kết quả nghiên cứu thực nghiệm4. Sử dụng các tiêu chuẩn thông dụng để chọn mô
hình
10
Kiểm định việc chọn mô hình
a. Kiểm định thừa biến (kiểm định Wald)Xét hai mô hình:
UXXXXYU kkmmmm 11221 ...:)(
VXXYR mm 11221 ...:)(
(U): mô hình không bị ràng buộc (Unrestricted model)(R): mô hình bị ràng buộc (Restricted model). Điều kiện ràng buộc là các hệ số hồi quy của các biến Xm , Xm+1 , Xk đồng thời bằng 0
11
a. Kiểm định Wald
Xây dựng giả thiết để kiểm định đk ràng buộc
0...: kmHo H1: có ít nhất một khác 0
B1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k bậc tự doB2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m bậc tự doB3: Tính F
j
)/()1()/()(
)/()/()(
2
22
knRmkRR
knRSSmkRSSRSSF
U
RU
U
UR
12
B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) Quy tắc quyết định:Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô hình (U) không thừa biến.Nếu dùng kết quả p-value thì quy tắc quyết định như sau:•Nếu p ≤ : Bác bỏ H0
•Nếu p > : Chấp nhận H0
a. Kiểm định Wald
13
Để kiểm định các biến giải thích bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước:Bước 1: Dùng OLS để ước lượng mô hình Yi = 1 + 2X2i + ui
Từ đó ta tính và R2old
Bước 2: dùng OLS để ước lượng mô hình
Tính R2new
Kiểm định giả thiết H0: 3 = 4 =… = k = 0
iY
iii vYYXY ...ˆˆ 34
23221
b. Kiểm định bỏ sót biến giải thích
14
Bước 3: Tính
n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào.Bước 4: Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số 3,4,…k không đồng thời bằng 0, mô hình cũ đã bỏ sót biến. Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H0
Nếu p > : Chấp nhận H0
)()1()(
2
22
knRmRRF
new
oldnew
b. Kiểm định bỏ sót biến giải thích
15
Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H0: ui có phân phối chuẩn
24)3(
6
22 KSnJB
3
3
.)(
u
i
SEnuu
S 4
4
.)(
u
i
SEnuu
K
Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0
c. Kiểm định giả thiết phân phối chuẩn của ui
Tiêu chuẩn lựa chọn mô hình
• R2, • R2 điều chỉnh, • Giá trị của hàm hợp lý log-likelihood
(L),• Tiêu chuẩn thông tin Akaike (AIC), • Tiêu chuẩn thông tin Schwarz (SIC)
16
Tiêu chuẩn R2
• R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình.
• R2 càng gần 1, mô hình càng phù hợp.
• Lưu ý:– Nó chỉ đo lường sự phù hợp “trong mẫu”
– Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau.
– R2 không giảm khi tăng thêm biến độc lập.
17
Tiêu chuẩn R2 điều chỉnh (R2)
• Ta thấyR2 R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1.
• Do vậy,R2 là tiêu chuẩn tốt hơn R2.• Lưu ý, các biến phụ thuộc cũng phải giống
nhau.
18
knnR
nTSSknRSSR
1)1(1
)1/()/(1 22
Giá trị của hàm hợp lý log-likelihood (L)
• Giá trị L càng lớn chứng tỏ mô hình càng phù hợp
19
22
21)2ln(
2ln
2 iUnnL
Tiêu chuẩn thông tin Akaike (AIC)
• Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cỡ mẫu.
• Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp.
20
hay
nkenRSSAIC /2.
nRSS
nkAIC ln2ln
Tiêu chuẩn thông tin Schwarz (SC)
• SC còn khắt khe hơn AIC.• SC càng nhỏ, mô hình càng tốt.
21
hay
nknnRSSSC /.
nRSSn
nkSC lnln
6. Các chỉ tiêu đánh giá mô hình dự báo
• Sai số dự báo
• Mẫu chia thành hai phầnMẫu khởi động: gồm các quan sát t=1,2,3...S-1Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h
22
ttt YYe ˆ
6.1 Trung bình sai số bình phương
Mean Squared Error
23
hS
Stteh
MSE 2
11
6.2 Căn bậc hai của trung bình sai số bình phương
• Root Mean Squared Error
24
MSERMSE
6.3 Trung bình sai số tuyệt đối
• Mean Absolute Error
• Các chỉ tiêu MSE, RMSE, MAE phụ thuộc đơn vị đo của biến dự báo.
25
hS
Stteh
MAE1
1
6.4 Trung bình của phần trăm sai số tuyệt đối
• Mean Absolute Percentage Error
26
hS
St t
t
Ye
hMAPE
11
6.5 Hệ số bất đẳng thức Theil
• Mean Absolute Error
• TIC thuộc [0;1]• TIC =0: hàm hồi quy dự báo chính xác
27
hS
Stt
hS
Stt Y
hY
h
RMSETIC22
11ˆ
11
6.6 Tỷ lệ độ chệch
• Bias Proportion: trung bình của giá trị dự báo khác so với trung bình giá trị thực tế
28
hS
Sttt YY
h
YYBP2
2
)ˆ(1
1ˆ
6.7 Tỷ lệ phương sai
• Variance Proportion: cho biết mức độ biến thiên của giá trị dự báo khác mức độ biến thiên của giá trị thiực tế
29
hS
Sttt
YY
YYh
SSVP
2
2ˆ
)ˆ(1)(
hS
StttY YY
hS 2
ˆ )ˆˆ(1
hS
StttY YY
hS 2)(1
6.8 Tỷ lệ hiệp phương sai
• Covariance Proportion: cho biết tỷ lệ phần sai số của dự báo không mang tính hệ thống
• BP+VP+CP=1• Mô hình dự báo tốt: BP và VP nhỏ
30
hS
Sttt
YYYY
YYh
SSrCP
2
ˆˆ
)ˆ(1)1(2
Ví dụ 1
• Cho Y: lượng hàng bán được của mặt hàng A (kg/tháng)
• X2: giá bán mặt hàng A (ngàn đồng/kg)• X3: giá bán của mặt hàng B (ngàn đồng/kg)• Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1
nếu kv khảo sát ở thành phố Sử dụng Eviews, hãy kiểm định Wald để phát
hiện thừa biến
31
32
X2 X3 Z Y2 14 1 203 13 0 193 15 1 184 16 0 184 11 1 173 16 1 174 10 0 164 17 1 165 13 1 155 12 1 155 14 0 146 15 1 146 13 0 137 14 1 127 12 0 125 16 1 154 15 0 167 18 1 128 16 0 108 20 1 11
B1. Chạy mô hình U
33
B2 Chạy mô hình R
34
B3 Tính F
• B4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ hoặc chấp nhận Ho.
Ho: Thừa biếnH1: Không thừa biến
35
)/()1()/()(
)/()/()(
2
22
knRmkRR
knRSSmkRSSRSSF
U
RU
U
UR
Ví dụ 1
Giả sử mô hình hồi quy
B1: Chạy mô hình hồi quy mẫuB2: Xác định hệ số hồi quy không có ý nghĩa
thống kê (có p>α). Lập giả thuyết HoB3: Chạy kiểm định Wald, xem giá trị F và p của F
để quyết định bác bỏ hay chấp nhận Ho36
iiiii uZXXY 433221
B1: Chạy hồi quy
37
• Giả sử α=5%, ta thấy hệ số hồi quy của biến X3 và Z có p > α nên biến X3 và Z khác 0 không có ý nghĩa.
• B2: Chạy kiểm định Wald cho giả thiếtH0: β3=β4 =0 , ta có kết quả
38
39
• Ta có F= 0.082219, p=0.9215> α nên ta chấp nhận giả thuyết H0: β3=β4 =0. Tức biến X3, Z không cần thiết đưa vào mô hình.
• Kết luận: Lượng hàng trung bình bán được của mặt hàng A chỉ phụ thuộc vào giá bán của mặt hàng A, không phụ thuộc vào giá bán mặt hàng B và khu vực bán.
40