Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 1
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
ΚΕΦΑΛΑΙΟ 3
ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ
ΜΕΤΑΒΛΗΤΩΝ
Μωυσιάδης Χρόνης
6o Εξάµηνο Μαθηµατικών
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
2Ποιοτικές Μεταβλητές ως προβλέπουσες
Τι συµβαίνει αν κάποια (ή κάποιες) Χi είναι ποιοτική ;
Προϋπόθεση : Προβλέπουσες µεταβλητές ποσοτικές (µετρήσιµες)
0 1 1 2 2 k kY X X Xβ β β β ε= + + + + +
όπου
Έστω Χ ποιοτική προβλέπουσα µε ν κατηγορίες. Τότε
αντικαθίσταται µε ν-1 βωβές µεταβλητές τις:
Xi Z1 Z2 Z3 ....... Zν-1
1
2
...
ν-1
ν
1
0
...
0
0
0
1
...
0
0
0
0
...
0
0
...
...
...
...
...
0
0
...
1
0
1η κατηγορία
2η κατηγορία
...
(ν-1)-στή κατηγορία
ν-στή κατηγορία
Ζ1, Ζ2, …, Ζν-1δείκτριες
µεταβλητές
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 2
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
3Παράδειγµα
Α, Β, C ποικιλίες από γαλοπούλες
Χ ηλικία (σε εβδοµ.)
Υ βάρος (σε pounds)
∆ιαφέρουν οι
ποικιλίες;
0.767
0.967
1.333
1.533
1.4
Γ
Γ
Γ
Γ
Γ
11.5
14.2
15.4
13.1
13.8
21
27
29
23
25
-0.35
-1.417
-0.217
-0.75
-0.967
-0.833
-0.45
-1.017
Α
Α
Α
Α
Β
Β
Β
Β
13.3
8.9
15.1
10.4
13.1
12.4
13.2
11.8
28
20
32
22
29
27
28
26
Ποικ.YXΠοικ.YX ˆY Yε = − ˆY Yε = −
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
4Παλινδροµήσεις (ανά ποικιλία)
30 31Y β β X ε= + +
Α Β Γ
-1.5
-0.5
0.5
1.5Μοντέλο
Y 1.98 0.4167X= +
( )ˆ( ) 4.450, 0.591, 0.824s β ′ =2
0.6647R =
(1)
0 1Y β β X ε= + +
Y -0.979 0.506 X= +
20 21Y β β X ε= + +
(για την ποικιλία Γ)
(για την ποικιλία Β)
(για την ποικιλία Α)
Χ Υ
28
20
32
22
13.3
8.9
15.1
10.4
10 11Y β β X ε= + +
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 3
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
5Με βωβές µεταβλητές
Χ Υ Ποικ. Z1 Z2
28
20
32
22
29
27
28
26
21
27
29
23
25
13.3
8.9
15.1
10.4
13.1
12.4
13.2
11.8
11.5
14.2
15.4
13.1
13.8
Α
Α
Α
Α
Β
Β
Β
Β
Γ
Γ
Γ
Γ
Γ
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0.158
-0.348
0.011
0.179
-0.255
0.018
0.332
-0.095
-0.153
-0.374
-0.147
0.474
0.200
ˆˆ Yε =Υ −
2 0.9794R =
1 2ˆ 1.92 2.19Y 1.43 0.49X= + − Ζ − Ζ
0 1 1 1 2 2Y β β X α +α ε= + + Ζ Ζ +
(2)
(για την Γ)
(για την Β)
(για την Α)
Y -0.7610 0.4868X= +
Y 1.4309 0.4868X= +
Y -0.4875 0.4868X= +
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
6Οπτικός έλεγχος του µοντέλου
Υπόλοιπα
ανά ποικιλία
Παλινδρόµηση
ανά ποικιλία
Α Β Γ
-0.4
-0.2
0.0
0.2
0.4
15 20 25 30 358
10
12
14
16ΑΒ
Γ
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 4
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
7ΕΡΩΤΗΜΑΤΑ
Οι ποικιλίες Α, Β, Γ διαφέρουν;
Η0 :
Η1 : όχι η Η0
1 2 0α α= =20 0 2β β α= +επειδή
30 0β β=
10 0 1β β α= +Η0 :
Η1 : όχι η Η0
10 20 30β β β= =
SSR = 38.60575
SSRΠ=26.20192
s2=0.09013
το (1) είναι περιορισµένο του
(2) που είναι το πλήρες
( )38.60575 26.20192 / 268.81
0.09013F
−⇒ = =
Άρα για α=0.05 η Η0 ΑΠΟΡΡΙΠΤΕΤΑΙ
ή δεν αρκεί το µοντέλο (1) να περιγράψει το Y
Όµως F2,9;0.05=9.43
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
8ΕΡΩΤΗΜΑΤΑ (συν.)
Οι ποικιλίες Α, Β είναι όµοιες
αλλά διαφέρουν από τη Γ;
Η0 :
Η1 : όχι η Η0
1 2 0α α= ≠Η0 :
Η1 : όχι η Η0
10 20 30β β β= ≠⇒
Τώρα περιορισµένο είναι το:
µε πλήρες το:0 1 1 1 2 2Y β β X α +α ε= + + Ζ Ζ +
0 1 1 2( )Y Xβ β α ε= + + Ζ + Ζ +
2
( ) /1 38.60575 38.454421.56
0.09013
SSR SSRF
s
Π− −⇒ = = =
Άρα για οποιοδήποτε α η Η0 ∆ΕΝ ΑΠΟΡΡΙΠΤΕΤΑΙ
ή δεν ισοδύναµα έχουµε δύο ποικιλίες τις Α,Β και τη Γ.
Όµως
F1,10;0.10=3.29
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 5
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
9ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ
(3)1 2
ˆ 1.620833 0.4791667 2.04375( )Y X= + − Ζ + Ζ
Γραφικές παραστάσεις
2 0.9525iε =∑
Σφάλµατα0.306, -0.26, 0.19, 0.281, -0.373, -0.115, 0.206, -0.235, -0.183, -0.358, -0.117, 0.458, 0.2
µε (παράβαλε 13.215 στο (1), 0.8112 στο (2) )
R2=0.9758 και s2=0.09525
Α Β Γ
-0.4
-0.2
0.0
0.2
0.4
15 20 25 30 358
10
12
14
16
Α ή Β
Γ
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
10Με αλληλεπίδραση
2 0.982R =
1 2 1 2ˆ 3.454 2.775 0.061 0.025Y 2.475 0.445X X X= + − Ζ − Ζ + Ζ + Ζ
0 1 1 1 2 2 1 1 2 2Y β β X α +α X + γ Xγ ε= + + Ζ Ζ + Ζ Ζ + (4)
(για την Γ)
(για την Β)
(για την Α)
Y -0.3 0.47X= +
Y 2.475 0.445X= +
Y -0.979 0.506 X= +
οι αλληλεπιδράσεις
15 20 25 30 358
10
12
14
16 Α
Β
Γ
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 6
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
11ΑΛΛΑ ΠΙΘΑΝΑ ΜΟΝΤΕΛΑ
2
0 1 22 2
0 1 2 1 0 1 2 22
0 1 2 1 2
( ) ( )
( )( )
Y β β X β X
X X + X X
X X +
γ γ γ δ δ δζ ζ ζ ε
= + + ++ + + Ζ + + Ζ ++ + + Ζ Ζ +
(7)
0 1 1 1 2 1 1 2( ) ( )Y β β X α + X +γ ε= + + Ζ Ζ + Ζ Ζ + (5)
2
0 1 2 1 1 2 2 1 22
3 1 2
( ) ( )
( )
Y β β X β X α + a X +
a X + ε= + + + Ζ Ζ + Ζ Ζ
+ Ζ Ζ + (6)
Πιο πολύπλοκο µοντέλο
Στο τελευταίο µοντέλο είναι k=11. Έτσι απαιτείται να είναι το n-k-1 τουλάχιστον 1, δηλαδή n≥13.
Το µοντέλο (3) µε αλληλεπιδράσεις
Με δευτεροβάθµιες σχέσεις και αλληλεπιδράσεις
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
12Άλλες βωβές Μεταβλητές
Είναι οι µεταβλητές W1,…,W5 κατάλληλες να
αντικαταστήσουν το Χ µε 6 κατηγορίες;
Z1 Z2 Z3 Z4 Z5
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
Χ W1 W2 W3 W4 W5
1
2
3
4
5
6
1
0
0
0
0
0
1
1
0
0
0
0
1
1
1
0
0
0
1
1
1
1
0
0
1
1
1
1
1
0
Συγκρί-
νουµε µε
τις µετα-
βλητές
Ζk
1 1
2 2 1
3 3 2
4 4 3
5 5 4
Z W
Z W W
Z W W
Z W W
Z W W
== −= −= −= −
1 1
2 1 2
3 1 2 3
4 1 2 3 4
5 1 2 3 4 5
W Z
W Z Z
W Z Z Z
W Z Z Z Z
W Z Z Z Z Z
== += + += + + += + + + +
καιΙσχύουν
άρα µπορούν οι Wk να χρησιµοποιηθούν αντί των Zk
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 7
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
13ΠΑΡΑ∆ΕΙΓΜΑ (άσκηση 3.1)
x y x1 x2 z
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10
10
11
13
14
14
16
16
15
16
16
17
17
17
18
1
2
3
4
5
6
7
8
9
9
9
9
9
9
9
0
0
0
0
0
0
0
0
0
1
2
3
4
5
6
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
x διαδοχικά έτη
y ζήτηση σε τόνους
Στο 9ο έτος ένα ανταγωνιστικό
προϊόν αναβαθµίστηκε
Θέτουµε
Περίοδος Ι τα έτη 1 έως 9
Περίοδος ΙΙ τα έτη 9 έως 15
Παρατηρούµε
x1 αυξάνει στην Ι, σταθερό στην ΙΙ
x2 αυξάνει στην ΙΙ, σταθερό στην Ι
x1+x2=x,
x3 είναι δείκτρια της ΙΙ
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
14Το µοντέλο
1 2 3 )0 1 2 3
Y β β X β X β X ε= + + + +
ˆ 11.428572 0.4285714 , 9Y X X= + >
Για x>9 είναι x=x2+9, x1=9, x3=1, οπότε:
(3)
ˆ( ) (0.375, 0.0743, 0.0909, 0.4981)s β ′ =
1 2 3ˆ 0.9761905 0.4285714 2.107143Y 8.607143 X X X= + + −
και SSR=92.7857όπου
(1)
ˆ 0.9761905 , 9Y 8.607143 X X= + <
Για x<9 είναι x=x1, x2=0, x3=0, οπότε:
(2)
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 8
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
15Γραφική παράσταση των µοντέλων
5 10 15
10
12
14
16
18
περ. I
περ. IΙ
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
16Υποθέσεις
Η0 :
Η1 : όχι η Η0
1 2 3 0β = β , β ≠
2
92.7857 87.7476221.75
0.2316
SSR SSRF
s
Σ− −= = =
και F1,12;0.05=4.75
⇒ ∆ΕΝ ΕΊΝΑΙ ΠΑΡΑΛΛΗΛΕΣ ΟΙ ΓΡΑΜΜΕΣ
Η0 :
Η1 : 03β ≠
03β = 2.1074.23
0.4981T−= =−
αλλά t11;0.95=-1.796 ⇒ ∆ΕΝ ΤΑΥΤΙΖΟΝΤΑΙ ΟΙ ΓΡΑΜΜΕΣ
που είναι συµπτυγµένο του πλήρους
1 2 3( ) )0 1 3
Y β β X X β X ε= + + + +ελέγχεται µε το µοντέλο
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 9
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
17ΕΤΕΡΟΣΚΕ∆ΑΣΤΙΚΟΤΗΤΑ
Αναγκαίες προϋποθέσεις εφαρµογής γραµµικού µοντέλου
2
( ) 0
( )
E
V
ε
ε σ
=
= Ι
ˆ , i
iys
ε
ή
οπτικός έλεγχος
Σχηµατίζουµε
τα γραφήµατα
2(0, )ε σΝ Ι∼
, i
ixs
ε
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
18Σχόλια
Υπάρχει συστηµατικό λάθος.
Το µοντέλο υπερ-εκτιµά την πραγµατικότητα στις µικρές τιµές του x
(ή ŷ ανάλογα) και την υπο-εκτιµά στις µεγάλες τιµές.
Πιθανή βελτίωση µε προσθήκη σταθερών όρων ή γραµµικά
συσχετισµένων µεταβλητών.
Υπάρχει αύξηση της διασποράς κατά τον άξονα x ή ŷ ανάλογα.
Πιθανή βελτίωση: Να θεωρηθεί . Τότε
προφανώς και το µοντέλο Y = β0+β1 X + ε
γράφεται Y/Χ = β1+β0 (1/X) + (ε/Χ) ή W = α0+α1 Z + e
που ικανοποιεί τις προϋποθέσεις
2( / )i iVar x kε =
2 2( )i iVar k xε =
Υπάρχει συστηµατικό λάθος.
Πιθανή βελτίωση µε προσθήκη δευτεροβάθµιων όρων.
(4)
(1)
(2)
(3)
σύµφωνα µε προϋποθέσεις
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 10
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
19ΠΑΡΑ∆ΕΙΓΜΑ (παρ. 3.3)
α/α x y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
294
247
267
358
423
311
450
534
438
697
688
630
709
627
615
999
1022
1015
700
850
980
1025
1021
1200
1250
1500
1650
30
32
37
44
47
49
56
62
68
78
80
84
88
97
100
109
114
117
106
128
130
160
97
180
112
210
135
x = πλήθος εργατών
y = πλήθος εξεταστών
Μοντέλο 0 1 εY β β X= + +
µε R2=0.776
x
sta
ndard
ized r
esid
uals
200 400 600 800 1000 1200 1400 1600
-2-1
01
Θέτουµε z=1/x και w=y/x
ˆ 14.448 0.105
(9.56) (0.011)
Y X= +
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
20µε το µετασχηµατισµό
α/α z w
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
0.00340
0.00405
0.00375
0.00279
0.00236
0.00322
0.00222
0.00187
0.00228
0.00143
0.00145
0.00159
0.00141
0.00159
0.00163
0.00100
0.00098
0.00099
0.00143
0.00118
0.00102
0.00098
0.00098
0.00083
0.00080
0.00067
0.00061
0.10204
0.12955
0.13858
0.12291
0.11111
0.15756
0.12444
0.11610
0.15525
0.11191
0.11628
0.13333
0.12412
0.15470
0.16260
0.10911
0.11155
0.11527
0.15143
0.15059
0.13265
0.15610
0.09500
0.15000
0.08960
0.14000
0.08182
Νέο Μοντέλο W=α0+α1Z+e
ˆ 0.121 3.803
(0.009) (4.57)
W Z= +µε R2=0.027
1/x
sta
ndard
ized r
esid
uals
0.001 0.002 0.003 0.004
-10
1
ˆ 3.803 0.121Y X= +
Οι τελευταίοι συντελεστές δεν είναι αξιόπιστοι
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 11
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
21Σύγκριση των δύο γραµµών
x
y
200 400 600 800 1000 1200 1400 1600
50
10
01
50
20
0
y=14.448+0.105 xy=3.803+0.121 x
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
22Μέθοδος Σταθµισµένων ε.τ.
ισχύουν:Y X β+ ε=
Ας υποθέσουµε ότι στο µοντέλο
2
( ) 0
( )
E
V V
ε
ε σ
=
=
ή
( )( )
( ) ( )
1 1
1 1 1 1 1 1
2 1 1 2 1 1 2
( ) ( ) ( ) 0
( ) ( ) ( ) ( )
( )
f P P
V f E f E f f E f E f f
P P P P P V P
P V P P P P P
ε ε
εε εε ε
σ σ σ
− −
− − − − − −
− − − −
Ε =Ε = Ε =
′ ′= − − = =
′ ′= Ε = Ε = =
= = = Ι
Επειδή V θ.ο. πίνακας ∃ πάντα µη=ιδιάζων συµµετρικός πίνακας P ώστε:
2(0, )Vε σΝ∼
Θέτοντας:
2P P P P P V′ = = =
1f P ε
−= ⇒
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 12
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
23Εκτίµηση συντελεστών µε σταθµ. ε.τ.
στο οποίο ικανοποιούνται οι
γνωστές προϋποθέσεις
1 1ˆ )-1β= (X V X ) (X V Y− −′ ′
Άρα 1 1 1Y X β+ ε P Y P X β+ P ε− − −= ⇒ =
άρα
Q Z β+ f=
οπότε
ˆ )-1β= (Z Z) (Z Q′ ′ ⇒
1 1 1 1ˆ )-1β= (X P P X ) (X P P Y− − − −′ ′ ⇒
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
24Για ασυσχέτιστες προβλέπουσες
1
2-1
3
n
ω 0 0 00 ω 0 0
V 0 0 ω 0
0 0 0 ω
⇒ =
ji i
i
X Y x y ′ = ∑
όπου
2
12
22 2
3
2
n
σ 0 0 0
0 σ 0 0(ε) = Vσ 0 0 σ 0
0 0 0 σ
V
=
Παρατηρούµε
2
i 2
i
σω =
σ
1
iω
ji i
i
X V Y x y− ′ = ∑
ji ki
i
X X x x ′ = ∑1
iω
ji ki
i
X V X x x− ′ = ∑
ενώ
ενώ
∆ηλαδή τα ωi λειτουργούν ως συντελεστές στάθµισης
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 13
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
25ΠΑΡΑ∆ΕΙΓΜΑ (το προηγούµενο)
Φαίνεται από το σχήµα
2 2
i(ε ) σ iVar x=Στο µοντέλο ε0 1Y β β X= + + υποθέτουµε
1
2
27
y
yY
y
=
1
2
27
11
1
x
xX
x
=
0
1
ββ
β =
1
2
27
εεε
ε
=
όπου:Y X β+ ε=
Ισοδύναµα
2
12
2 2
2
0 0
0 0( )
0 0n
x
xV
x
ε σ
=
και
1 1
1
ˆ )
0.00010467 0.0465041534 0.006024740.0465041534 27 3.44360728
3.8030.121
-1β= (X V X ) (X V Y− −
−
′ ′ =
= = =
δηλαδή προέκυψε
πάλι το ίδιο µοντέλο
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
26ΣΤΑΤΙΣΤΙΚΟ Durbin - Watson
υποθέσουµε ότι
( )n
2
t t-1
t=2
n2
t
t=2
ε - ε
ε
d =∑
∑
ανεξάρτητη των
1 ... ε0 1 k kY β β X β X= + + + +
t t-1 tρε ε η= +
Αν στο µοντέλο
2
tη (0,σ )N∼όπου
s
sρ ρ=είναι τότε ο συντ. συσχ. των σφαλµάτων
tηκαι
ελέγχει την υπόθεση
t -1 t-2 t-1 t-2ε , ε , ..., η , η ,...
Το στατιστικό
Η0 : ρ=0
Η1 : ρ>0
Η0 : ρ=0
Η1 : ρ<0
Η0 : ρ=0
Η1 : ρ≠0ήή
Από πίνακες υπολογίζονται για διάφορα α οι τιµές dL, dU, και συγκρίνουµε µε
την τιµή του d.
i i+sε , ε
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 14
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
27Σχηµατικός έλεγχος DW τεστ
H0 : ρρρρ = 0
θετική αυτοσυσχέτιση
H1 : ρρρρ > 0
0 dL du 2
ΑΠΟΡ.
H0 δεν απορ.
δεν αποφ.
DW
(d)4-du 4-dL 4
δεν αποφ.
ΑΠΟΡ.
H0
H0 : ρρρρ = 0
αρνητική αυτοσυσχέτιση
H1 : ρρρρ < 0
δεν απορ.
H0 : ρρρρ = 0
H1 : ρρρρ ≠ 0
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
28Παράδειγµα
Στο τελευταίο παράδειγµα
βρίσκουµε:
( )n
2
k k-1
k=2
n2
k
k=2
ε - ε
2.579
ε
d = =∑
∑
Από πίνακες βρίσκουµε ότι για k=1 (προβλέπουσες µεταβλητές) και n=27,
και για α=0.05 τα όρια είναι dL=1.316, και dU=1.469
0 dL du 2 4-du 4
2.6841.316 1.469
2.579
4-dL
2.531
⇒ ∆εν µπορούµε να αποφασίσουµε
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 15
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
29Όρια του στατιστικού D-W
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
30Όρια του στατιστικού D-W (συν.)
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 16
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
31Θέµατα (1)
Ο διπλανός πίνακας περιέχει εξαµηνιαίες
µετρήσεις των πωλήσεων µιας επιχείρησης.
Είναι γνωστό ότι οι πρώτες 5 µετρήσεις έχουν
µια γραµµική σχέση, οι επόµενες 4 έχουν µια
άλλη γραµµική σχέση, όπως φαίνεται οπτικά κι
από το σχήµα. Το ερώτηµα είναι κατά πόσον
αυτές οι γραµµικές σχέσεις είναι ίδιες ή
διαφορετικές. Κάναµε δύο παλινδροµήσεις και
πήραµε τα παρακάτω µοντέλα πρόβλεψης
(1) ,
µε SSR=128.18, SST=132.62
(2) ,
µε SSR=131.51
α) Να βρεθούν οι γραµµικές σχέσεις στα διαστήµατα x≤5 και x≥5, και να
παρασταθούν γρα-φικά.
β) Εξετάστε αν οι δύο γραµµές ταυτίζονται (να
διατυπωθεί η υπόθεση την οποία θα ελέγξετε)
ˆ 1.5361 1.4617y x= + ⋅
1 2ˆ 9.8714 1.9238 0.9995y x x= + ⋅ + ⋅
x Ηµεροµηνία x1 x2 y
1 Μάρ. 1970 -4 0 2.3
2 Σεπ. 1970 -3 0 3.8
3 Μάρ. 1971 -2 0 6.5
4 Σεπ. 1971 -1 0 7.4
5 Μάρ. 1972 0 0 10.2
6 Σεπ. 1972 0 1 10.5
7 Μάρ. 1973 0 2 12.1
8 Σεπ. 1973 0 3 13.2
9 Μάρ. 1974 0 4 13.6
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
32Θέµατα (2)
Σε µια µελέτη της σχέσης των µισθών µε το κοινωνικο-οικονοµικό-εκπαιδευτικό
επίπεδο των εργαζοµένων ο ερευνητής χώρισε τα 55 άτοµα που συµµετείχαν σε τρεις
κατηγορίες 1=χαµηλό, 2=µέσο και 3=υψηλό. Κατέγραψε τους µηνιαίους µισθούς τους
Y σε € την εµπειρία τους X σε έτη.
Στη συνέχεια όρισε βωβές µεταβλητές Ζ1 µε τιµή 1 για τα άτοµα χαµηλού επιπέδου και
0 για τα άλλα και Ζ2 µε τιµή 1 για τα άτοµα µεσαίου επιπέδου και 0 για τα άλλα.
Συµβόλισε τέλος W1=X⋅Z1 και W2=X⋅Z2 τις µεταβλητές που συνδυάζουν την εµπειρία
µε το επίπεδο του εργαζοµένου. Όρισε τέλος και τις µεταβλητές U1=Z1+Z2 και
U2=X⋅(Z1+Z2)=W1+W2.
Μεταβλητές στο µοντέλο Αθροίσµατα, Συντελεστές
(Χ) SST=1588000, SSR=456000, (β0,β1)=(496.1, 18.4).
(Χ,Ζ1,Ζ2,W1,W2) SSR=1521000, (β0, β1, γ1, γ2, δ1, δ2)=(684.3, 18.4,-300.3,-239.6,-1.3,-1.4)
(Χ,U1,U2) SSR=1497000, (β0, β1, ε1, ε2)=(684.3, 18.3,-261.3,-3.8)
Προκειµένου να βρεθεί ένα µοντέλο πρόβλεψης του µισθού σε κάθε επίπεδο των
εργαζοµένων έγινε µια σειρά από παλινδροµήσεις, ορισµένα από τα αποτελέσµατα των
οποίων δίνονται στον πίνακα. Στο σχήµα δίνονται γραφικά οι τρεις γραµµές
παλινδρόµησης.
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 17
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
33Θέµατα (2 συν.)
x
y
5 10 15 20
40
05
00
60
07
00
80
09
00
10
00
11
1
11
1
11
1
11
1
1
1
1
1
1
1
1
1
1
1 1
22
222
2
22
2
2
2
22
3
3
3
3
33
33
33
33
3
3
3
333
3
Στο σχήµα δίνονται γραφικά οι τρεις γραµµές παλινδρόµησης.
α) Βρέστε συνδυάζοντας
κατάλληλα τις πληροφορίες
του πίνακα, τα µοντέλα
πρόβλεψης του µισθού από
την εµπειρία σε κάθε επίπεδο
και σηµειώστε τα στο σχήµα.
β) Ποια µηδενική υπόθεση
ελέγχει το εάν οι τρεις ευθείες
ταυτίζονται; ∆ιατυπώστε την
υπόθεση µε τρόπο που να
αφορά τις παραµέτρους ενός
µοντέλου και στη συνέχεια
κάντε τον έλεγχο.
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
34Θέµατα (3)
Χ1 Χ2 Χ3 Y
10.0 27.0 12.8 28.0
10.0 27.0 12.5 24.5
10.0 28.5 10.7 28.0
10.0 28.5 11.6 28.0
10.0 30.0 11.7 31.5
11.6 34.5 12.6 52.5
11.6 27.0 11.7 49.0
11.6 27.0 12.8 49.0
11.6 25.5 12.7 45.5
11.6 27.0 12.0 38.5
11.6 28.5 13.3 42.0
11.6 30.0 12.0 52.5
12.4 36.0 12.6 98.0
12.4 33.0 12.6 63.0
12.4 34.5 12.6 63.0
12.4 36.0 13.3 66.5
12.4 36.0 13.3 70.0
15.0 40.5 12.8 147.0
15.0 40.5 12.7 129.5
15.0 37.5 13.0 129.5
15.0 30.0 13.1 52.5
Εικοσιµία παρατηρήσεις της µεταβλητής Υ για δοσµένες
τιµές των Χ1, Χ2 και Χ3 δίνονται στο διπλανό πίνακα.
µεταβλητές SSR
(1) 18498.0
(2) 19429.6
(3) 4052.3
(1 , 2) 22083.3
(1 , 3) 18602.0
(2 , 3) 19528.7
(1 , 2 , 3) 22206.2
Προκειµένου να βρεθεί το καλύτερο µοντέλο που
εκτιµά τις τιµές της Υ από αυτές των Χ1, Χ2 και Χ3
έγιναν όλες οι δυνατές παλινδροµήσεις της Υ µε τις Χk,
k=1,2,3. ∆ίνεται ότι SST=25348.2, και ότι το SSR για τα
διάφορα µοντέλα είναι:
όπου οι αριθµοί στις παρενθέσεις δηλώνουν ποιες µεταβλητές
είναι στο µοντέλο.
Εφαρµοσµ. Ανάλ. Παλινδρ.& ∆ιασποράς- Μετασχηµατισµοί Μεταβλητών 18
Μωυσιάδης Πολ.-Τµήµα
Μαθηµατικών ΑΠΘ
35Θέµατα (3 συν.)
α) Βρέστε το καλύτερο και το αµέσως καλύτερο µοντέλο µε το κριτήριο
R2. Να αποδειχθεί ο ισχυρισµός σας µε κατάλληλο έλεγχο.
β) Παρατηρώντας ότι η µεταβλητή Χ1 έχει τέσσερις κατηγορίες, ορίσαµε
τρεις βωβές µεταβλητές τις Ζ1, Ζ2 και Ζ3 που παίρνουν την τιµή 1 όταν η
Χ1 είναι αντίστοιχα 10, 11.6 και 12.4 και 0 αλλού. Στη συνέχεια κάναµε
παλινδρόµηση θεωρώντας το µοντέλο
Υ=β0+β2Χ2+β3Χ3+α1Ζ1+α2Ζ2+α3Ζ3+ε, και πήραµε R2=0.8896, ενώ οι
συντελεστές παλινδρόµησης ήταν αντίστοιχα:
(β0,β2,β3,α1,α2,α3)=(−40.18, 4.99, −2.37, −44.52, −25.64, −32.44).
Βρέστε το µοντέλο πρόβλεψης της Υ για τις 4 κατηγορίες της Χ1 και
δείξτε ότι τα τέσσερα αυτά µοντέλα ταυτίζονται αν ισχύει α1=α2=α3=0.
Στη συνέχεια, κάντε τον έλεγχο αν τα τέσσερα µοντέλα ταυτίζονται.