Upload
cornelia-maria
View
78
Download
3
Embed Size (px)
Citation preview
1
Academia de stiinte economice
Management, anul III
PROIECT ECONOMETRIE
Dianu Maria Cornelia
Seria A, grupa 135
2014
2
Problema A
nregistrai pentru 42 de uniti (judee), valorile specifice ale unei perechi de
caracteristici (X i Y) ntre care exist o legtur logic. Datele prezentate sub forma tabelar fac
parte din lucrare.
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform
teoriei economice);
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
2.2- Reprezentarea grafic a modelului legturii dintre variabile
3. Estimarea parametrilor modelului i interpretarea acestora
3.1- Estimarea punctual a parametrilor
3.2- Estimarea parametrilor prin interval de ncredere
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
4.2- Testarea parametrilor unui model de regresie simplu
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu i
interpretarea rezultatelor
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Testarea liniaritii modelului propus
6.2- Testarea normalitii erorilor
6.3- Testarea ipotezei de homoscedasticitate
6.4- Testarea ipotezei de autocorelare a erorilor
7. Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare
nregistrat (inclusiv interval de ncredere) pentru toate variantele cunoscute.
Rezolvarea problemei A de exemplificat att n Excel ct i n Eviews.
Problema B
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile,
conform teoriei economice);
2. Definirea modelului de regresie multipl liniar
2.1- Forma, variabilele, parametrii modelului de regresie multipl
2.2 -Reprezentarea grafic a modelului legturii dintre variabile
3. Estimarea parametrilor modelului i interpretarea acestora
3.1- Estimare punctual a parametrilor
3.2- Estimarea parametrilor prin interval de ncredere
4. Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie multipl
3
4.1- Testarea semnificaiei corelaiei multipl
4.2- Testarea parametrilor modelului de regresie multipl
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie multipl i interpretarea rezultatelor
6. Testarea ipotezelor clasice asupra modelului de regresie multipl
6.1 Testarea liniaritii modelului propus
6.2 Testarea normalitii erorilor
6.3 Testarea ipotezei de homoscedasticitate
6.4 Testarea ipotezei de autocorelare a erorilor
7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Rezolvarea problemei B de exemplificat att n Excel ct i n Eviews.
Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou populaii
(variabila exogen i variabila endogen) sunt egale; testai dac mediile celor dou populaii
sunt egale. Rezolvarea problemei C de exemplificat n Excel, cu interpretarea rezultatelor i
parcurgerea etapelor testrii ipotezelor statistice.
4
Rezolvare
Problema A:
Un analist doreste sa studieze legatura dintre numarul mediu de salariati femei , numarul
somerilor femei si castigul salarial nominal mediu net lunar pentru femei. In acest scop, el
sitematizeaza datele pentru cele 42 judete privind numarul mediu de salariati femei , numarul
somerilor femei si castigul salarial nominal mediu net lunar pentru femei.
Judet
Nr mediu de salariati femei
x1 Numarul somerilor femei x2 C salarial nominal mediu net lunar pt femei y
Bihor 75 6774 1013
Bistrita-Nasaud 27 3821 1050
Cluj 87 7658 1289
Maramures 41 7003 1030
Satu-Mare 36 3619 1056
Salaj 20 3606 1058
Alba 36 7587 1179
Brasov 67 7661 1223
Covasna 21 3706 1072
Harghita 28 5489 1012
Mures 54 8372 1179
Sibiu 52 4410 1226
Bacau 50 6821 1184
Botosani 26 3771 1103
Iasi 67 8431 1265
Neamt 36 6756 1065
Suceava 42 7752 1104
Vaslui 27 6671 1083
Braila 30 4300 1067
Buzau 36 7340 1067
Constanta 78 9873 1189
Galati 46 8668 1225
Tulcea 19 2995 1168
Vrancea 27 4551 1074
Arges 58 8680 1333
Calarasi 21 3645 1009
Dambovita 36 7398 1170
Giurgiu 14 3284 1133
Ialomita 19 3916 1100
Prahova 76 11771 1239
Teleorman 23 6949 1032
5
Ilfov 45 2121 1521
Municipiul
Bucuresti 383 12298 1910
Dolj 57 12209 1169
Gorj 28 6629 1244
Mehedinti 19 4830 1189
Olt 28 5502 1055
Valcea 33 6151 1133
Arad 43 4853 1165
Caras-Severin 24 4908 1072
Hunedoara 54 7460 1041
Timis 86 5678 1371
Prezentarea legaturii dintre variabila x1, nr mediu de salariati femei si
variabila y, castigul salarial nominal mediu net lunar pt femei y
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile,
conform teoriei economice)
Proiectul urmareste realizarea unui model econometric ( regresie simpla liniara) referitor la
datele despre nr mediu de salariati femei si castigul salarial nominal mediu net lunar pt femei
2010 pentru cele 42 de judete, mai exact urmareste sa determine in ce masura e influentat
numarul mediu de salariati femei de salarial nominal mediu net lunar pt femei .
Salarial nominal mediu net lunar pt femei s-a calculate prin raportarea sumelor cuvenite drept
salariul femeilor existente pe piata muncii in anul de referinta . Pe baza datelor problemei se
poate construi un model econometric unifactorial de forma:
uxfy )(
unde:
y - valorile reale ale variabilelor dependente;
x - valorile reale ale variabilelor independente;
u - variabila rezidual, reprezentnd influenele celorlali factori ai variabilei y,
nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra
variabilei y.
Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea
specificare a variabilelor:
6
y castigul salarial nominal mediu net lunar pt femei 2010, reprezentnd variabila
rezultativ, ale crei valori depind de o mulime de factori numarul somerilor femei,etc.
x numarul mediu de salariati femei, factorul considerat prin ipoteza de lucru cu
influena cea mai puternic asupra variabilei y.
Specificarea unui model econometric presupune, de asemenea, alegerea unei funcii
matematice f x cu ajutorul creia poate fi descris legtura dintre cele variabile. n cazul unui model unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic a celor
dou iruri de valori cu ajutorul corelogramei.
y = 2.305x + 1049.6 R = 0.6591
0
500
1000
1500
2000
2500
0 100 200 300 400 500
Legatura dintre nr mediu de salariati femei si castigul salarial nominal mediu net lunar pt femei
castigul salarialnominal mediu netlunar pt femei y
Linear (castigul salarialnominal mediu netlunar pt femei y)
7
Din grafic se poate observa c distribuia punctelor empirice x yi i, poate fi aproximat cu o dreapt. Ca atare, modelul econometric care descrie legtura dintre cele dou variabile se
transform ntr-un model liniar unifactorial ubxay , a i b reprezentnd parametrii
modelului, b 0 , panta dreptei fiind pozitiv deoarece legtura dintre cele dou variabile este
liniar.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
In acest proiect am urmarit gradul de influenta a castigului salarial nominal mediu net
lunar pt femei asupra numarului mediu de salariati femei, in anul 2010.
Ecuatia modelului de regresie liniar simpl este urmatoarea :
Castigul salarial nominal mediu net lunar pt femei =c(1)+c(2)* nr mediu de salariati femei
+e, din care:
- Variabila endogena este: castigul salarial nominal mediu net lunar pt femei;
- Variabila exogena este: nr mediu de salariati femei in anul 2010;
- c(1),c(2)-parametrii modelului de regresie;
- e-variabila eroare
2.2- Reprezentarea grafic a modelului legturii dintre variabile
Se observa ca legatura dintre variabile este directa si liniara (intrucat dreapta de regresie
are panta pozitiva ).
y = 2.305x + 1049.6 R = 0.6591
0
500
1000
1500
2000
2500
0 100 200 300 400 500
Legatura dintre nr mediu de salariati femei si castigul salarial nominal mediu net lunar pt femei
castigul salarialnominal mediu netlunar pt femei y
Linear (castigul salarialnominal mediu netlunar pt femei y)
8
Se observa ca legatura dintre variabile este directa si liniara (intrucat dreapta de regresie are
panta pozitiva ).
3. Estimarea parametrilor modelului i interpretarea acestora
Output Excel
9
Output eviews
=
= 49,40
=
=
= 1049,62
5625.00 75975.00 8221.73
729.00 28350.00 4271.75
7569.00 112143.00 10492.43
1681.00 42230.00 6296.06
1296.00 38016.00 4621.48
400.00 21160.00 3296.11
1296.00 42444.00 4641.72
4489.00 81941.00 7674.35
441.00 22512.00 3118.96
784.00 28336.00 4288.77
2916.00 63666.00 7426.28
2704.00 63752.00 6130.31
2500.00 59200.00 8061.40
676.00 28678.00 5618.90
4489.00 84755.00 13147.41
10
22650.25 51965797.58 5625.00 49818619.90
12882.25 10379654.24 501.97 9661199.90
15750.25 84703117.97 1413.40 87028929.07
17822.25 27731341.99 70.64 26343127.38
11556.25 12712627.30 179.69 11957605.96
11130.25 5009149.79 864.64 4548038.20
240.25 11990426.96 179.69 12098011.51
3540.25 41619874.00 309.59 42391124.51
8372.25 4190042.81 806.83 3823821.49
22952.25 10737196.73 458.16 9767288.82
1296.00 38340.00 6047.60
1764.00 46368.00 9470.32
729.00 29241.00 5799.92
900.00 32010.00 4014.27
1296.00 38412.00 5349.62
6084.00 92742.00 9864.53
2116.00 56350.00 7575.07
361.00 22192.00 2911.64
729.00 28998.00 4231.91
3364.00 77314.00 7638.05
441.00 21189.00 3772.52
1296.00 42120.00 6094.99
196.00 15862.00 3127.53
361.00 20900.00 3512.78
5776.00 94164.00 8841.25
529.00 23736.00 4161.25
2025.00 68445.00 3430.59
146689.00 731530.00 27761.68
3249.00 66633.00 8822.88
784.00 34832.00 5249.83
361.00 22591.00 3667.44
784.00 29540.00 5332.35
1089.00 37389.00 4767.36
1849.00 50095.00 6221.79
576.00 25728.00 3876.96
2916.00 56214.00 5413.58
7396.00 117906.00 9507.64
11
240.25 39028508.40 21.12 39222414.33
3906.25 24052282.03 6.74 24669227.36
420.25 47298669.01 0.35 47581062.78
3660.25 20393360.60 547.78 19850596.85
10302.25 141191733.17 309.59 143614165.21
9702.25 24826325.08 179.69 23854454.68
3540.25 69995232.54 54.83 69003181.27
6480.25 22249357.27 501.97 21496413.01
9312.25 8686390.94 376.54 8126880.39
9312.25 18340875.39 179.69 17523641.05
650.25 75264772.51 817.69 75707874.65
3782.25 40323369.54 11.59 41108210.21
20.25 3040264.94 924.45 3055977.91
8010.25 9972375.74 501.97 9415120.66
28730.25 39753682.15 73.88 41919825.07
23870.25 7637039.97 806.83 6806982.70
42.25 24255477.48 179.69 24319544.53
930.25 3978163.62 1253.50 3857427.33
4032.25 5821528.93 924.45 5519137.55
5700.25 57794242.90 707.31 58947883.27
17292.25 9792216.30 697.21 8986515.35
127806.25 3646533.40 19.40 5139696.39
557262.25 668309437.96 111285.78 707463260.73
30.25 58581872.51 57.69 58666095.43
6480.25 16046681.04 458.16 16698100.07
650.25 6142661.38 924.45 6269712.03
11772.25 18295704.52 458.16 17379292.29
930.25 13208605.68 269.12 12987839.69
2.25 25571128.92 41.02 25586301.54
8372.25 7867772.63 645.40 7362838.11
15006.25 19119416.21 21.12 18063141.47
43056.25 66204932.95 1339.21 69624695.37
1048202.5 1857729845 135006.0028 1897265276.04
3.1- Estimarea punctual a parametrilor
Din output se observa ca ecuatia de regresie este urmatoare: Yt =1049,621+2,305Xt
0=1049,621 si 1=2,305 ( 0, 1 reprezinta estimatorii modelului de regresie)
1>0 => legatura puternica
12
Daca numarul mediu de salariati femei creste, castigului salarial nominal mediu net lunar
pt femei va creste cu 1049,621 .
In RESIDUAL OUTPUT observam coloanele Predicted castigul salarial nominal mediu net
lunar pt femei si Residuals. Prima se calculeaza dupa ecuatia de regresie
( t = 1049,621+2,305Xt), iar cea de-a doua se calculeaza utilizand formula: t=Yt - t
RESIDUAL OUTPUT
Observation
Predicted castigul salarial nominal mediu net lunar pt
femei Residuals
1 1222.497663 -209.4976626
2 1111.856465 -61.8564646
3 1250.157962 38.84203784
4 1144.126814 -114.126814
5 1132.601689 -76.60168924
6 1095.72129 -37.72128989
7 1132.601689 46.39831076
8 1204.057463 18.94253703
9 1098.026315 -26.02631485
10 1114.16149 -102.1614896
11 1174.092139 4.907861497
12 1169.482089 56.51791142
13 1164.872039 19.12796133
14 1109.55144 -6.551439646
15 1204.057463 60.94253703
16 1132.601689 -67.60168924
17 1146.431839 -42.43183899
18 1111.856465 -28.8564646
19 1118.771539 -51.77153948
20 1132.601689 -65.60168924
21 1229.412738 -40.41273752
22 1155.651939 69.34806117
23 1093.416265 74.58373507
24 1111.856465 -37.8564646
25 1183.312238 149.6877617
26 1098.026315 -89.02631485
27 1132.601689 37.39831076
28 1081.89114 51.10885986
29 1093.416265 6.583735068
30 1224.802688 14.1973124
31 1102.636365 -70.63636477
32 1153.346914 367.6530861
13
33 1932.44535 -22.44535007
34 1181.007213 -12.00721338
35 1114.16149 129.8385104
36 1093.416265 95.58373507
37 1114.16149 -59.16148956
38 1125.686614 7.31338564
39 1148.736864 16.26313605
40 1104.94139 -32.94138973
41 1174.092139 -133.0921385
42 1247.852937 123.1470628
Estimarea parametrilor se face pornind de la urmatorul sistem:
{
Estimarea parametrului 0
= 1049,62
Estimarea parametrului
b1 :
=
= 2,305
14
3.2- Estimarea parametrilor prin interval de ncredere
4828219.50250618135006,002*42
232551*
40
1857729845
)(*
)(
)()SE(
2
22
2
2
0
x
txn
tx
kn
ty
ty
xt
xn
tx
65299040.262093328135006,002
1*
40
1857729845
)(
1*
)(
)(
1)1SE(
2
2
2
xtxknt
yt
y
xt
x
Interval de incredere
2,305 2,58 * 0,262 2,305+2,58* 0,262
1,629 2,980
Interval de incredere
1049,62- 2,58 * 19,502 1049,62 + 2,58 * 19,502
999,30484 1099,935
15
Deoarece intervalul de incredere al parametrului 0 nu include valoarea nula, rezulta ca acesta este
semnificativ statistic.
Deoarece intervalul de incredere al parametrului 1 nu include varianta nula, rezulta ca acesta este
semnificativ statistic.
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
Masurarea intensitatii legaturii dintre cele doua variabile se face cu ajutorul a trei indicatori:
- Coeficientul de corelatie liniara;
- Raportul de corelatie;
- Coeficientul de determinare sau determinatie.
Coeficientul de corelatie liniara
81,0
)2387983689-57904957*24305625)(4232551*42(
48867*2075-2713999*42
/ 2222
iiii
iiii
yynxxn
yxyxn
yxr
Coeficientul de corelatie liniara= Multiple R=0,81 tinde catre 1 si este mai mare ca 0
asadar rezulta o legatura puternica si directa intre numarul mediu de salariati femei si castigul
salarial nominal mediu net lunar pentru femei in anul 2010.
Ne incadram in intervalul (0,8 ; 1) deoarece numarul mediu de salariati femei
influenteaza variatia castigului salarial nominal mediu net lunar pentru femei in proportie de 281,0
=0,656 , deci 65,6 % . Restul de 34,5% se datoreaza influentelor exercitate de alti
factori aleatori sau intamplatori .
16
Verificarea semnificatiei coeficientului de corelatie
- Se stabileste ipoteza nula: H0: r=0;
- Se stabileste ipoteza alternativa: H1: r0;
- Se calculeaza testul z :
79,881,01
4081,0
1
2
22
r
nrZ calculat
Daca |zcalculat|>zcritic=> 8,79 > 2,58 respingem H0;
Acceptam H1 => coeficientul de corelatie este semnificativ statistic
Pentru o probabilitate de 95% exista suficiente dovezi pentru a concluziona ca se respinge
ipoteza nula H0 si se accepta H1,coeficientul este semnificativ 0 si semnificativ statistic.
4.2- Testarea parametrilor unui model de regresie simplu
Testarea parametrilor modelului
Testarea lui 0:
- Etapa 1 : se stabilete ipoteza nul: H0: 0 = 0 (coeficientul este nesemnificativ statistic)
- Etapa 2 : se stabilete ipoteza alternativ: H1: 1 (coeficientul este semnificativ statistic)
- Etapa 3 : n=42
- Etapa 4 : = 0,95
- Etapa 5 : Z calculat
z 0=
=
= 53,79
-Etapa 6 : Valoarea critica
|z0| > zcritic => 53,79> 2,58 => resping H0, accept H1=> coeficientul este semnificativ statistic
17
Testarea lui 1:
- Etapa 1 : se stabilete ipoteza nul: H0: 0 = 0 (coeficientul este nesemnificativ staatistic)
- Etapa 2 : se stabilete ipoteza alternativ: H1: 1 (coeficientul este semnificativ statistic)
- Etapa 3: n=42
- Etapa 4 : = 0,95
- Etapa 5 : Z calculat
z 1=
=
= 8,79
- Etapa 6 : Valoarea critica
|z1| > zcritic => 8,79 >2,58=> resping H0, accept H1 coeficientul este semnificativ statistic
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu i
interpretarea rezultatelor
Tabelul ANOVA se completeaza pe baza urmatoarelor formule:
df SS MS F Significance F
Regression k-1 SSR=( t- )2
MSR=
Fcalc=
modelul
este valid
Residual n-k SSE=(yt- t)2
MSE=
Total n-1 SST=( t- )2
SSR=( t- )2= 1897265276.04
SSE=(Yt- )2= 1857729845
SST=( t- )2= 1048202.5
MSR=
=
= 1897265276.04
18
MSE=
= MSE=
= 46433246
Testarea validitatii modelului
- Se stabileste ipoteza nula: H0: modelul este nevalid;
- Se stabileste ipoteza alternativa: H1: modelul este valid;
- Se calculeaza Fcalc.
Fcalc=
= 40,86
Daca Fcalc>Fcritic=> 40,86 >4 => resping H0, accept H1 =>modelul este valid
Daca Fcalcresping H1, accept H0.
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
Coeficientul de corelatie liniara
81,0
)2387983689-57904957*24305625)(4232551*42(
48867*2075-2713999*42
/ 2222
iiii
iiii
yynxxn
yxyxn
yxr
Coeficientul de corelatie liniara= Multiple R=0,81 tinde catre 1 si este mai mare ca 0
asadar rezulta o legatura puternica si directa intre numarul mediu de salariati femei si castigul
salarial nominal mediu net lunar pentru femei in anul 2010.
Ne incadram in intervalul (0,8 ; 1) deoarece numarul mediu de salariati femei
influenteaza variatia castigului salarial nominal mediu net lunar pentru femei in proportie de 281,0
=0,656 , deci 65,6 % . Restul de 34,5% se datoreaza influentelor exercitate de alti
factori aleatori sau intamplatori .
19
Verificarea semnificatiei coeficientului de corelatie
- Se stabileste ipoteza nula: H0: r=0;
- Se stabileste ipoteza alternativa: H1: r0;
- Se calculeaza testul z :
79,881,01
4081,0
1
2
22
r
nrZ calculat
Daca |zcalculat|>zcritic=> 8,79 > 2,58 respingem H0;
Acceptam H1 => coeficientul de corelatie este semnificativ statistic
Pentru o probabilitate de 95% exista suficiente dovezi pentru a concluziona ca se respinge
ipoteza nula H0 si se accepta H1,coeficientul este semnificativ 0 si semnificativ statistic.
Verificarea semnificatiei raportului de determinare
- Etapa 1: Se stabileste ipoteza nula: H0: R2
x/y=0;
- Etapa 2 :Se stabileste ipoteza alternativa: H1: R2
x/y0;
- Etapa 3: n=42
- Etapa 4 : = 0,05
- Etapa 5 : Se calculeaza Fcalc
0,65
1048202.5
.041897265276
1
2
1
2
2
n
i
i
n
i
i
yy
yy
R
21,362
39
65,01
65,01
1 2
2
k
kn
R
RFc
- Etapa 6 : Regiunea critica:
20
Fcalc>Fcritic => 36,21 >4 => resping H0 si accept H1
6.3-Testarea normalitii erorilor
Testarea ipotezei de normalitate a erorilor se realizeaza cu ajutorul testului Jarque-
Bera, bazat pe calculul coeficientului de asimetrie Skewness si al coeficientului de
aplatizare Kurtosis
JB=f(K,S)
H0: K=3, S=0, ipoteza de normalitate a erorilor
H1: K3, S0
Dac Prob (JB) < 0,05 => Se accepta ipoteza H0, caz n care nu avem o distribuie
normal.
Prob (JB)=43,93 > 0,05 =>. In acest caz ipoteza de normalitate a erorilor are un nivel
suficient de ridicat (43,93 > 0,05 )pentru a accepta ipoteza H0. Distribuia este normal.
Coeficientul de asimetrie Skewness
21
28,107112140548.
96922037906
3
3)(1
yi
yns
Coeficientul de aplatizare Kurtosis
30,73.665407753649
4405200001313670582
4
4)(1
yi
yns
-3408863 513033825
1157625000 1215506250000
2141700569 2760652033441
1092727000 1125508810000
1177583616 1243528298496
1184287112 1252975764496
1638858339 1932213981681
1829276567 2237205241441
1231925248 1320623865856
1036433728 1048870932736
1638858339 1932213981681
1842771176 2259237461776
1659797504 1965200244736
1341919727 1480137458881
2024284625 2560720050625
1207949625 1286466350625
1345572864 1485512441856
1270238787 1375668606321
1214767763 1296157203121
1214767763 1296157203121
1680914269 1998607065841
1838265625 2251875390625
1593413632 1861107122176
1238833224 1330506882576
2368593037 3157334518321
1027243729 1036488922561
1601613000 1873887210000
1454419637 1647857448721
22
1331000000 1464100000000
1902014919 2356596484641
1099104768 1134276120576
3518743761 5352009260481
6967871000 13308633610000
1597509809 1867488966721
1925134784 2394867671296
1680914269 1998607065841
1174241375 1238824650625
1454419637 1647857448721
1581167125 1842059700625
1231925248 1320623865856
1128111921 1174364509761
2576987811 3533050288881
69220379069 86866093419561
Un alt argument pentru faptul ca distribuitia nu este normala este coeficientul de aplatizare
( Kurtosis) ce are o valoare de 7,30 arata faptul ca distributia este mai ridicata decat cea normala
( cea normala fiind de 3).
Astfel, testul Jarque-Bera, care ia in considerare cei doi coeficienti comentati mai sus, are
o valoare de 43,93, in conditiile in care valoarea sa critica pentru pragul de semnificatie de 5%
este de 5,96, deci erorile nu au o distributie normala, respingandu-se homoscedasticitatea.
6.4- Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate se realizeaza cu ajutorul testului WHITE.
Aceasta presupune faptul ca variabila aleatoare sau reziduala este de medie nula, iar dispersia
ei este constanta si independenta de X, putand admite faptul ca legatura dintre X si Y este relativ
stabila.
23
t=0+1X1+2X1
Dac Fcalc Homoscedasticitate.
Dac Fcalc>Fcrit => Heteroscedasticitate.
H0: 1 = 2 = 0
H1: 1, 2 0
Fcalc 0,44< 0,64 => Pentru o probabilitate de 95% avem suficiente dovezi sa
acceptam ipoteza Ho de homoscedastica si se respingem ipoteza H1.
6.4Testarea ipotezei de autocorelare a erorilor
-209.497663 43889.271 0.000 43889.271
-61.8564646 3826.222 -209.4977 21797.923
38.84203784 1508.704 -61.85646 10140.188
-114.126814 13024.930 38.84204 23399.470
-76.6016892 5867.819 -114.1268 1408.135
-37.7212899 1422.896 -76.60169 1511.685
46.39831076 2152.803 -37.72129 7076.107
18.94253703 358.820 46.39831 753.820
-26.0263148 677.369 18.94254 2022.198
24
-102.16149 10436.970 -26.02631 5796.565
4.907861497 24.087 -102.1615 11463.846
56.51791142 3194.274 4.907861 2663.597
19.12796133 365.879 56.51791 1398.008
-6.55143965 42.921 19.12796 659.432
60.94253703 3713.993 -6.55144 4555.437
-67.6016892 4569.988 60.94254 16523.618
-42.431839 1800.461 -67.60169 633.521
-28.8564646 832.696 -42.43184 184.291
-51.7715395 2680.292 -28.85646 525.101
-65.6016892 4303.582 -51.77154 191.273
-40.4127375 1633.189 -65.60169 634.483
69.34806117 4809.154 -40.41274 12047.433
74.58373507 5562.734 69.34806 27.412
-37.8564646 1433.112 74.58374 12642.799
149.6877617 22406.426 -37.85646 35172.837
-89.0263148 7925.685 149.6878 56984.410
37.39831076 1398.634 -89.02631 15983.186
51.10885986 2612.116 37.39831 187.979
6.583735068 43.346 51.10886 1982.487
14.1973124 201.564 6.583735 57.967
-70.6363648 4989.496 14.19731 7196.753
367.6530861 135168.792 -70.63636 192097.643
-22.4453501 503.794 367.6531 152176.790
-12.0072134 144.173 -22.44535 108.955
129.8385104 16858.039 -12.00721 20120.209
95.58373507 9136.250 129.8385 1173.390
-59.1614896 3500.082 95.58374 23946.085
7.31338564 53.486 -59.16149 4418.909
16.26313605 264.490 7.313386 80.098
-32.9413897 1085.135 16.26314 2421.085
-133.092139 17713.517 -32.94139 10030.172
123.1470628 15165.199 -133.0921 65658.528
357302.386
771743.095
DW=
15,2
357302.386
771743.095
1
2
2
2
1
n
i
i
n
i
ii
25
Atunci cnd ntre t i t-1 exist autocorelare negativ la 4-d1< DW
26
- Proiectul urmareste realizarea unui model econometric ( regresie multipla) referitor
la datele despre nr mediu de salariati femei ,numarul somerilor femei si castigul salarial
nominal mediu net lunar pt femei 2010 pentru cele 42 de judete, mai exact urmareste sa
determine in ce masura e influentat numarul mediu de salariati femei si numarul somerilor
femei de castigul salarial nominal mediu net lunar pt femei .
2. Definirea modelului de regresie simpl liniar
Definirea modelului de regresie multipl liniar
Notm cu :
Y - variabila castigul salarial nominal mediu net lunar pt femei.
X1 - variabila Nr mediu de salariati femei,
X2 - variabila Numarul somerilor femei
yi = f ( x1i , x2i )
castigul salarial nominal mediu net lunar pt femei = f (Nr mediu de salariati femei,
Numarul somerilor femei)
iii eyy
2.1- Forma, variabilele i parametrii modelului de regresie
In acest proiect am urmarit gradul de influenta a castigului salarial nominal mediu net
lunar pt femei si a numarului somerilor femei asupra numarului mediu de salariati femei, in anul
2010.
Ecuatia modelului de regresie liniar multipla este urmatoarea :
- Castigul salarial nominal mediu net lunar pt femei =c(1)+c(2)* nr mediu de
salariati femei +c(3)* numarul somerilor femei +e, din care:
- Variabila endogena este: castigul salarial nominal mediu net lunar pt femei;
- Variabilele exogene sunt: nr mediu de salariati femei in anul 2010; numarul somerilor
femei
- c(1),c(2), c(3) -parametrii modelului de regresie;
- e-variabila eroare
27
2.2- Reprezentarea grafic a modelului legturii dintre variabile
Legatura dintre nr mediu de salariati femei si numarul somerilor femei si castigul salarial
nominal mediu net lunar pt femei .
Se observa ca legatura dintre variabile este directa si liniara (intrucat dreapta de regresie are
panta pozitiva )
y = 24.594x + 5116.3 R = 0.3158
y = 2.305x + 1049.6 R = 0.6591
0
2000
4000
6000
8000
10000
12000
14000
16000
0 100 200 300 400 500
Numarul somerilorfemei x2
castigul salarialnominal mediu netlunar pt femei y
Linear (Numarulsomerilor femei x2)
Linear (castigul salarialnominal mediu netlunar pt femei y)
28
3. Estimarea parametrilor modelului i interpretarea acestora
Output Excel
Output Eviews
29
3.1- Estimarea punctual a parametrilor
Din output se observa ca ecuatia de regresie este urmatoare:
Yt = 1082,81+2,46X1-0,006489 X2
0= 1082,81, 1=2,46 si 2 =-0,006489 ( 0, 1, 2 reprezinta estimatorii modelului de regresie)
In RESIDUAL OUTPUT observam coloanele Predicted Personalul didactic din
invatamant si Residuals. Prima se calculeaza dupa ecuatia de regresie (Yt = 1082,81+2,46X1-
0,006489 X2), iar cea de-a doua se calculeaza utilizand formula: t=Yt - t
RESIDUAL OUTPUT
Observation
Predicted castigul salarial nominal mediu net lunar pt
femei y Residuals
1 1223.71 -210.71
2 1124.57 -74.57
3 1247.549 41.4506
4 1138.427 -108.427
5 1148.062 -92.0623
6 1108.713 -50.7128
7 1122.315 56.68506
8 1198.238 24.76229
9 1110.529 -38.5286
10 1116.211 -104.211
11 1161.584 17.41572
12 1182.363 43.63656
13 1161.79 22.21013
14 1122.43 -19.4299
15 1193.241 71.75861
16 1127.707 -62.7071
17 1136.032 -32.032
18 1106.077 -23.0771
19 1128.856 -61.8558
20 1123.918 -56.9177
21 1210.995 -21.9953
22 1139.947 85.05328
23 1110.213 57.78716
24 1119.833 -45.8332
25 1169.444 163.5558
26 1110.924 -101.924
27 1123.541 46.45869
28 1096.015 36.98547
30
29 1104.237 -4.23671
30 1193.75 45.2495
31 1094.415 -62.4148
32 1179.964 341.0361
33 1946.967 -36.9665
34 1144.081 24.91918
35 1108.814 135.1857
36 1098.306 90.694
37 1116.127 -61.1271
38 1124.239 8.761068
39 1157.307 7.692574
40 1110.123 -38.1229
41 1167.502 -126.502
42 1257.932 113.0675
Estimarea parametrilor se face pornind de la urmatorul sistem:
{
Coefficients Coeficienii
Intercept 1082,81 0b termen liber
Numar decede 2,46 1b coeficient de regresie (primul factor)
Pensia medie lunara 0,006489 2b coeficient de regresie (al doilea factor)
0= 1082,81, 1=2,46 si 2 =-0,006489
0b termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regesie y
intersecteaz axa Oy n punctul 1082,81
46,21 b , ceea ce nsemn c creterea numrului deceselor, pensia medie lunara va crete cu2,46;
006489,02 b ne arat c, la o cretere cu 1 an a duratei medii de viata, pensia medie lunara va
nregistra o cretere cu 23,78.
31
3.2- Estimarea parametrilor prin interval de ncredere
0 ( 0- tcritic*SE( 0); 0+ tcritic*SE( 0)) => 1082,81 (997,93 ; 1167,70)
1 ( 1- tcritic*SE( 1); 1+ tcritic*SE( 1)) => 2,46 (1,82 ; 3,10)
2 ( 2- tcritic*SE( 2); 2+ tcritic*SE( 2)) => -0,00648 (-0,021169 ; 0,00819)
Deoarece intervalul de incredere al parametrului 0 nu include valoarea nula, rezulta ca
acesta este semnificativ statistic.
Deoarece intervalul de incredere al parametrului 1 nu include varianta nula, rezulta ca
acesta este semnificativ statistic.
Deoarece intervalul de incredere al parametrului 2 include valoarea nula, rezulta ca acesta
nu este semnificativ statistic.
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
Masurarea intensitatii legaturii dintre cele doua variabile se face cu ajutorul a trei
indicatori:
- Coeficientul de corelatie liniara;
- Raportul de corelatie;
- Coeficientul de determinare sau determinatie.
yx
ii
yx
xyn
xxyyxyr
,cov/
32
Coeficientul de corelatie liniara= Multiple R=0,81 tinde catre 1, asadar rezulta o
legatura puternica si directa intre castigul salarial nominal mediu net lunar pt femei si numarul
somerilor femei, nr mediu de salariati femei.
Verificarea semnificatiei coeficientului de corelatie
- Se stabileste ipoteza nula: H0: r=0;
- Se stabileste ipoteza alternativa: H1: r0;
- Se calculeaza testul z :
79,881,01
4081,0
1
2
22
r
nrZ calculat
Daca |zcalculat|>zcritic=> 8,79 > 2,58 respingem H0;
Acceptam H1 => coeficientul de corelatie este semnificativ statistic
Pentru o probabilitate de 95% exista suficiente dovezi pentru a concluziona ca se respinge
ipoteza nula H0 si se accepta H1,coeficientul este semnificativ 0 si semnificativ statistic.
Verificarea semnificatiei raportului de corelatie
- Se stabileste ipoteza nula: H0: Rx/y=0;
- Se stabileste ipoteza alternativa: H1: Rx/y0;
- Se calculeaza Fcalc
33
2
2
1*)/2(
R
RknFcalc
81,01048202,5
.041897265276/
SST
SSRR xy
SSR=( t- )2= 1897265276.04
SST=( t- )2= 1048202.5
4.2- Testarea parametrilor unui model de regresie multipla
Testarea parametrilor modelului
Testarea lui 0:
- Etapa 1 : se stabilete ipoteza nul: H0: 0 = 0 (coeficientul este nesemnificativ statistic)
- Etapa 2 : se stabilete ipoteza alternativ: H1: 1 (coeficientul este semnificativ statistic)
- Etapa 3 : n=42
- Etapa 4 : = 0,95
- Etapa 5 : Z calculat
z 0=
=
= 25.80
-Etapa 6 : Valoarea critica
|z0| < zcritic => 25,80> 2,58 => resping H0, accept H1=> coeficientul este semnificativ statistic
Testarea lui 1
- Etapa 1 : se stabilete ipoteza nul: H0: 0 = 0 (coeficientul este nesemnificativ staatistic)
- Etapa 2 : se stabilete ipoteza alternativ: H1: 1 (coeficientul este semnificativ statistic)
- Etapa 3: n=42
- Etapa 4 : = 0,95
34
- Etapa 5 : Z calculat
z 1=
=
= 7,75
- Etapa 6 : Valoarea critica
|z1| > zcritic => 7,75 >2,58=> resping H0, accept H1 coeficientul este semnificativ statistic
Testarea lui 2
- Etapa 1 : se stabilete ipoteza nul: H0: 0 = 0 (coeficientul este nesemnificativ staatistic)
- Etapa 2 : se stabilete ipoteza alternativ: H1: 2 (coeficientul este semnificativ statistic)
- Etapa 3: n=42
- Etapa 4 : = 0,95
- Etapa 5 : Z calculat
z 2=
=
= -0.893
- Etapa 6 : Valoarea critica
|z2| > zcritic => -0.893 >2,58=> resping H0, accept H1 coeficientul este semnificativ statistic.
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie multipla i
interpretarea rezultatelor
Tabelul ANOVA se completeaza pe baza urmatoarelor formule:
df SS MS F Significance F
Regression k-1 SSR=( t- )2
MSR=
Fcalc=
modelul
este valid
Residual n-k SSE=(yt- t)2
MSE=
Total n-1 SST=( t- )2
35
SSR=( t- )2= 1897265276.04
SSE=(Yt- )2= 1857729845
SST=( t- )2= 1048202.5
MSR=
=
= 1897265276.04
MSE=
= MSE=
= 46433246
Testarea validitatii modelului
- Se stabileste ipoteza nula: H0: modelul este nevalid;
- Se stabileste ipoteza alternativa: H1: modelul este valid;
- Se calculeaza Fcalc.
Fcalc=
= 40,86
Daca Fcalc>Fcritic=> 40,86 >4 => resping H0, accept H1 =>modelul este valid
Daca Fcalcresping H1, accept H0.
6. Testarea ipotezelor clasice asupra modelului de regresie multipl
6.1- Testarea liniaritii modelului propus
Coeficientul de corelatie liniara
81,0
)2387983689-57904957*24305625)(4232551*42(
48867*2075-2713999*42
/ 2222
iiii
iiii
yynxxn
yxyxn
yxr
36
Coeficientul de corelatie liniara= Multiple R=0,81 tinde catre 1 si este mai mare ca 0
asadar rezulta o legatura puternica si directa intre numarul mediu de salariati femei si castigul
salarial nominal mediu net lunar pentru femei in anul 2010.
Ne incadram in intervalul (0,8 ; 1) deoarece numarul mediu de salariati femei
influenteaza variatia castigului salarial nominal mediu net lunar pentru femei in proportie de 281,0
=0,656 , deci 65,6 % . Restul de 34,5% se datoreaza influentelor exercitate de alti
factori aleatori sau intamplatori .
Verificarea semnificatiei coeficientului de corelatie
- Se stabileste ipoteza nula: H0: r=0;
- Se stabileste ipoteza alternativa: H1: r0;
- Se calculeaza testul z :
79,881,01
4081,0
1
2
22
r
nrZ calculat
Daca |zcalculat|>zcritic=> 8,79 > 2,58 respingem H0;
Acceptam H1 => coeficientul de corelatie este semnificativ statistic
Pentru o probabilitate de 95% exista suficiente dovezi pentru a concluziona ca se respinge
ipoteza nula H0 si se accepta H1,coeficientul este semnificativ 0 si semnificativ statistic.
Verificarea semnificatiei raportului de determinare
- Etapa 1: Se stabileste ipoteza nula: H0: R2
x/y=0;
- Etapa 2 :Se stabileste ipoteza alternativa: H1: R2
x/y0;
- Etapa 3: n=42
37
- Etapa 4 : = 0,05
- Etapa 5 : Se calculeaza Fcalc
0,65
1048202.5
.041897265276
1
2
1
2
2
n
i
i
n
i
i
yy
yy
R
21,362
39
65,01
65,01
1 2
2
k
kn
R
RFc
- Etapa 6 : Regiunea critica:
Fcalc>Fcritic => 36,21 >4 => resping H0 si accept H1
6.2- Testarea normalitii erorilor
Testarea ipotezei de normalitate a erorilor se realizeaza cu ajutorul testului Jarque-
Bera, bazat pe calculul coeficientului de asimetrie Skewness si al coeficientului de
aplatizare Kurtosis
38
JB=f(K,S)
H0: K=3, S=0, ipoteza de normalitate a erorilor
H1: K3, S0
Dac Prob (JB) < 0,05 => Se accepta ipoteza H0, caz n care nu avem o distribuie
normal.
Prob (JB)=23,86 > 0,05 =>. In acest caz ipoteza de normalitate a erorilor are un nivel
suficient de ridicat (23,86 > 0,05 )pentru a accepta ipoteza H0. Distribuia este normal.
Coeficientul de asimetrie Skewness
87715789145.18
96922037906
3
3)(1
yi
yns
Coeficientul de aplatizare Kurtosis
11911772924907
95618686609341
4
4)(1
yi
yns
Un alt argument pentru faptul ca distribuitia nu este normala este coeficientul de
aplatizare ( Kurtosis) ce are o valoare de 6,06 arata faptul ca distributia este mai ridicata decat
cea normala ( cea normala fiind de 3).
Astfel, testul Jarque-Bera, care ia in considerare cei doi coeficienti comentati mai sus, are
o valoare de 23,86 in conditiile in care valoarea sa critica pentru pragul de semnificatie de 5%
este de 0,000007 , deci erorile nu au o distributie normala, respingandu-se homoscedasticitatea.
39
6.4 Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate se realizeaza cu ajutorul testului WHITE.
Aceasta presupune faptul ca variabila aleatoare sau reziduala este de medie nula, iar dispersia
ei este constanta si independenta de X, putand admite faptul ca legatura dintre cei doi X si Y
este relativ stabila.
t=0+1X1+2X1
Dac Fcalc Homoscedasticitate.
Dac Fcalc>Fcrit => Heteroscedasticitate.
H0: 1 = 2 = 0
H1: 1, 2 0
Prob (F-statistic) = 0,000772 Acceptam ipoteza H1 si se respinge ipoteza H0
Pentru o probabilitate de 95% avem suficiente dovezi sa acceptam ipoteza Ho de homoscedastica si se respingem ipoteza H1.
40
6.4 Testarea ipotezei de autocorelare a erorilor
-210.7101147 44398.752 0.000 44398.752
-74.57002625 5560.689 -210.7101147 18534.124
41.45059681 1718.152 -74.57002625 13460.785
-108.4274152 11756.504 41.45059681 22463.418
-92.06225163 8475.458 -108.4274152 267.819
-50.7128272 2571.791 -92.06225163 1709.775
56.68506385 3213.196 -50.7128272 11534.307
24.76228557 613.171 56.68506385 1019.064
-38.52856444 1484.450 24.76228557 4005.732
-104.2114211 10860.020 -38.52856444 4314.238
17.4157235 303.307 -104.2114211 14793.162
43.63656271 1904.150 17.4157235 687.532
22.21013416 493.290 43.63656271 459.092
-19.42985206 377.519 22.21013416 1733.888
71.75861443 5149.299 -19.42985206 8315.336
-62.70707808 3932.178 71.75861443 18081.022
-32.03196102 1026.047 -62.70707808 940.963
-23.07712073 532.554 -32.03196102 80.189
-61.85575375 3826.134 -23.07712073 1503.782
-56.91765463 3239.619 -61.85575375 24.385
-21.99534665 483.795 -56.91765463 1219.568
85.0532792 7234.060 -21.99534665 11459.408
57.78716454 3339.356 85.0532792 743.441
-45.83324694 2100.687 57.78716454 10737.190
163.5558105 26750.503 -45.83324694 43843.777
-101.9243775 10388.579 163.5558105 70479.730
46.45869222 2158.410 -101.9243775 22017.535
36.98546568 1367.925 46.45869222 89.742
-4.236707046 17.950 36.98546568 1699.268
45.24950181 2047.517 -4.236707046 2448.885
-62.41480684 3895.608 45.24950181 11591.603
341.0361175 116305.633 -62.41480684 162772.648
-36.96654893 1366.526 341.0361175 142886.016
24.91918081 620.966 -36.96654893 3829.844
135.1857411 18275.185 24.91918081 12158.714
90.6940002 8225.402 135.1857411 1979.515
-61.12706749 3736.518 90.6940002 23049.637
41
8.761068344 76.756 -61.12706749 4884.352
7.692574135 59.176 8.761068344 1.142
-38.12293381 1453.358 7.692574135 2099.061
-126.5020063 16002.758 -38.12293381 7810.860
113.0675052 12784.261 -126.5020063 57393.551
350127.209
763522.853
DW=
18,2
350127,209
763522,853
1
2
2
2
1
n
i
i
n
i
ii
Verificarea ipotezei de autocorelare a erorilor se realizeaza cu ajutorul testarii Durbin-
Watson
Atunci cnd ntre t i t-1 exist autocorelare negativ la 4-d1< DW
42
Problema C
Problema C:
1=
=
= 49.404
2=
=
=6331
=
= 1163
x12 =
x22 =
y2 =
5625 195932.699 49818619.90
501.973356 6301892.985 9661199.90
1413.401927 1759981.27 87028929.07
70.64002268 451104.1276 26343127.38
179.6876417 7356881.27 11957605.96
864.6400227 7427571.556 4548038.20
179.6876417 1576638.985 12098011.51
309.5924036 1767950.128 42391124.51
806.8304989 6892500.128 3823821.49
458.1638322 709565.5561 9767288.82
21.11621315 4164223.27 39222414.33
6.735260771 3691613.27 24669227.36
0.35430839 239750.1276 47581062.78
547.7828798 6555428.699 19850596.85
309.5924036 4408500.128 143614165.21
179.6876417 180321.5561 23854454.68
54.83049887 2018226.128 69003181.27
501.973356 115357.2704 21496413.01
376.5447846 4126411.842 8126880.39
179.6876417 1017360.413 17523641.05
5930310.42
6249073035.)(2
n
xxi
5930310.42
6249073035.)(2
n
xxi
4517298242
.041897265276)(2
n
yyi
43
817.6876417 12543234.13 75707874.65
11.59240363 5459899.842 41108210.21
924.4495465 11131278.98 3055977.91
501.973356 3169671.556 9415120.66
73.87811791 5516123.27 41919825.07
806.8304989 7216514.699 6806982.70
179.6876417 1137726.985 24319544.53
1253.497166 9286385.556 3857427.33
924.4495465 5833950.128 5519137.55
707.3066893 29589714.41 58947883.27
697.2114512 381482.699 8986515.35
19.40192744 17727107.27 5139696.39
111285.7829 35600826.98 707463260.73
57.68764172 34546685.56 58666095.43
458.1638322 88591.27041 16698100.07
924.4495465 2254073.27 6269712.03
458.1638322 687833.2704 17379292.29
269.1162132 32528.69898 12987839.69
41.02097506 2185539.842 25586301.54
645.4019274 2025945.556 7362838.11
21.11621315 1273834.699 18063141.47
1339.211451 426875.5561 69624695.37
135006.0028 249073035.6 1897265276.04
Testarea ipotezei privind raportul dintre dispersia populatiei scolare totala si dispersia
personalului didactic din invatamant
Test unilateral dreapta
12/21
:1
yx
H
0000711,045172982
3214
2
21
y
xcalculat
F
Fcalc 0,0000711 < 4 => resping H0 si accept H1 => se accepta ipoteza conform careia
dispersia numarului mediu de salariati femei este
este mai mica decat disperia castigului
salarial nominal mediu net lunar pt femei .
12/21
:0 yxH
44