C3 Testarea ipotezelor

  • View
    266

  • Download
    6

Embed Size (px)

Text of C3 Testarea ipotezelor

  • C3. Testarea ipotezelor statistice

  • Etapele verificrii ipotezelor statistice

    Identificarea ipotezelor ce trebuie testateAlegerea testului statisticSpecificarea nivelului de semnificaieStabilirea regulii de decizieCulegerea datelor i realizarea calculelorLuarea deciziei de respingere sau nu a ipotezei statistice

    Condiia esenial: variabila urmeaz o repartiie normal

  • Ipotez statistic = presupunerea (enunul) formulat cu privire la parametrul unei repartiii sau la legea de repartiie pe care o urmeaz o variabil aleatoare.

    Ipotez nul (H0) = ipoteza care se consider a priori adevrat.

    Ipotez alternativ (HA) = o ipotez care contrazice ipoteza nul.

  • Formele ipotezei nule H0 si ipotezei alternative HA (exemplificare pentru compararea parametrului media colectivitii generale cu valoarea ipotetica 0)test bilateral:

    H0: = 0HA: 0 ( < 0 sau > 0)test unilateral dreapta:

    H0: 0HA: > 0test unilateral stnga:

    H0: 0HA: < 0

  • Testul statistic: se calculeaz statistica testului i se compar cu valoarea teoretic (valoare critic) => decizia de a respinge sau nu ipoteza nul H0.

    Regiunea critic: interval de valori delimitat de valoarea critic. Dac valoarea calculat a testului statistic se afl n regiunea critic, ipoteza H0 se respinge.

  • Eroare de tip I = eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat. Probabilitatea (riscul) comiterii unei erori de tip I este ; se numete nivel sau prag de semnificaie; trebuie s fie f. mic ( = 0,005; 0,01 etc)P-value=cel mai mic nivel de semnificaie la care poate fi respins ipoteza nul.

    Nivelul de ncredere al unui test statistic este (1-) -> n expresie procentual, (1-)100 reprezint probabilitatea ca rezultatele s fie adevrate.

  • Eroare de tip II = eroarea pe cere o facem acceptnd o ipotez nul, dei este fals.Probabilitatea (riscul) comiterii unei erori de tip II este . Puterea testului statistic este (1-).

  • TIPURI DE ERORI N TESTAREA IPOTEZELOR STATISTICE

    = P(respingere H0 H0 este adevrat)=P(eroare de tip I) = P(acceptare H0 H0 este fals)= P(eroare tip II)

    Decizia deIpoteza adevrat este:a accepta:H0HAH0Decizie corect(probabilitate 1-)Eroare de tip II(risc )HAEroare de tip I(risc )Decizie corect(probabilitate 1-)

  • Efectuarea testului statisticCondiia esenial n verificarea ipotezelor statistice este c variabila urmeaz o repartiie normalSe extrage un eantion aleator din respectiva populaie

    Pe baza eantionului se calculeaz valoarea estimatorului parametrului populaiei de interes i apoi valoarea testuluiForma general a testului statistic:

  • Decizie: dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem ipoteza nul i acceptm ipoteza alternativ. Aceast decizie este incorect doar n 100 % din cazuri;dac valoarea numeric a testului nu se afl n regiunea critic (Rc), nu se respinge ipoteza nul H0.

  • I. Teste pentru media populaiei: dispersia 2 este cunoscut, n 30Testul zSe formuleaz ipotezaSe extrage un eantion aleator din populaie i se calculeaz mediaSe calculeaz valoarea statisticii z:

    Se stabilete pragul de semnificaie (de regul 0,05)Se compar valoarea calculat z cu o valoare tabelat z (valoare critic) i se ia decizia de acceptare/respingere

  • TESTIpoteza nul H 0 Ipoteza alternativ H A Deciziabilateralm = m0 m m0 unilateral dreaptam < m0 m > m0 unilateral stngam > m0 m < m0

  • Regiunea critic a) b) c)Regiunea critic pentru: a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga

  • ExempluSe tie c preul mediu al unui apartament cu 2 camere n Bucureti este de 65000 euro, cu o abatere standard de 2000 euro.

    Din cercetrile unei agenii imobiliare pe un eantion de 36 apartamente reiese c n cartierul Aviaiei preul mediu este 68000 euro.Se poate afirma, folosind o probabilitate de 95%, ca preul mediu al unui apartament cu 2 camere n cartierul Aviaiei este semnificativ mai mare dect media capitalei?

  • Soluie-testul zVariabila de interes: X preul mediu al unui apartament cu 2 camere presupunem o distribuie normal Dispersia populaiei este cunoscut, deci aplicm testul z.

    Ipotezele (test unilateral dreapta):H0: 0H1: > 0

    Pragul de semnificaie: Valoarea critic: z(0,05)=1,6

  • Valoarea testului:

    Verificarea:

    z=9 > z(0,05)= 1,6 => respingem H0 => acceptam HA : putem afirma cu probabilitatea de 95% c preul mediu al unui apartament cu 2 camere n cartierul Aviaiei este semnificativ mai mare dect media capitalei.

  • II. Teste privind media populaiei generale () pentru eantioane de volum redus i dispersia 2 necunoscut Se estimeaz dispersia populaiei cu dispersia de eantion:

    Pentru esantioane de volum redus (n

  • Regiunea critic-testul t a) b) c)Regiunea critic pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga

  • Exemplul 1 testul t Volumul unei cutii de bere este de 0.33 litri. Pentru a verifica acest lucru se selecteaz aleator un eantion de 16 cutii. n urma prelucrrii datelor, s-au obinut urmtoarele rezultate:

    Confirm datele corectitudinea mbutelierii? Folosii un nivel de ncredere de 95%.

  • Variabila de interes: X volumul unei cutii de bere presupunem o distribuie normal Dispersia populaiei este necunoscut - poate fi estimat prin dispersia esantionului:

    Volumul mediu ipotetic: Volumul mediu din eantion:

    Pragul de semnificaie:

  • Ipotezele:

    Valoarea critic:

    Valoarea testului:

    Verificarea:

    Decizia : nu sunt suficiente motive pentru a respinge ipoteza nul (cu probabilitatea 95% sau cu riscul de a grei de 5%) .

  • Ex. 2. Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul n anul curent. Valorile estimate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (mil lei, preurile anului anterior). tiind c profitul companiei n anul anterior a fost de 1,9 mil. lei, media previziunilor experilor este semnificativ mai mare dect profitul anului anterior (pentru = 0,1)?

    Rezolvare. Media previziunilor experilor este mil. lei, cu dispersia:

    i abaterea medie ptratic:

    Folosim testul t.

  • Testarea ipotezei statistice:H0: 1,9H1: > 1,9 (test unilateral dreapta).

    Regiunea critic: t > t;n-1 = t0,1;4 = 2,132 Cum t=2,206 < t0,1;4 = 2,132, respingem ipoteza nul => acceptam c media previzionat este semnificativ mai mare dect profitul anului trecut.