7-Testarea Ipotezelor Statistice. Teste de Medie

Embed Size (px)

Citation preview

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    1/21

    TESTAREA  IPOTEZELOR 

    STATISTICE Călinici Tudor

    OBIECTIVE EDUCAŢIONALE 

    Definirea conceptului de test statistic

    Prezentarea etapelor unui test statistic

    Prezentarea şi exemplificarea testelor de tip Z

    pentru comparația mediilor

    Prezentarea și exemplificarea testelor de tip Tpentru comparația mediilor

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    2/21

    IPOTEZE 

    Formularea de noi ipoteze (sau modele sau teorii)este una dintre cele mai importante aspecte alecercetării  ştiinţifice. Aceste ipoteze încercă  să descrie sau să explice anumite fenomene reale. Inmulte cazuri există  ipoteze anterioare (descrierisau explicaţii)  pe care oamenii de ştiinţă  dorescsă le înlocuiască cu altele noi

    Pentru a fi valabile, ipotezele trebuie să  fietestate

    POPULAŢIE - EŞANTION 

    Atunci cînd o investigaţie de tip statistic se efectuează pe

    un eşantion, orice rezultat obţinut are o valoare relativă,

    în sensul că datele respective nu numai că nu coincid cu

    cele referitoare la populaţie, dar nici măcar nu se poate

    afirma cu certitudine care este diferenţa dintre cele douăgenuri de date, de vreme ce starea populaţiei este, de

    regulă, necunoscută.

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    3/21

    IPOTEZA STATISTICĂ 

    Prin urmare, asupra  populaţiilor   studiate selectiv nu se

     pot emite  judecăţi  cu valoare de certitudine, ci se pot

    exprima nişte supoziţii care poartă denumirea de ipoteze

    statistice. 

    Testarea ipotezelor statistice înseamnă 

    supunerea ipotezelor unor probe, numite teste statistice,

    operaţie  în urma căreia  ipoteza se respinge sau se

    acceptă. O  asemenea decizie are întotdeauna la  bază calculul intervalului de confidenţă  ce corespunde unui

     prag de semnificaţie ales 

    TEST STATISTIC - CONCEPT 

    Testarea unei ipoteze statistice se face princompararea a două ipoteze concurente: Ipoteza nulă –  modelul pe care cercetătorul doreşte

    să îl înlocuiască Ipoteza alternativă –  noul model, menit să

    înlocuiască ipoteza nulă

    Exemplu de ipoteză statistică: Populaţia X estediferită de populaţia Y din punct de vedere al ... 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    4/21

    SCOPUL TESTULUI STATISTIC 

    Scopul testului statistic este de a dovedi căipoteza nulă este falsă. 

    Rezultatul testului Nu putem afirma că acceptăm ipoteza nulă O putem sau nu nega

    ETAPELE UNUI TEST STATISTIC 

    Definirea ipotezelor

     Alegerea unui parametru  Alegerea unui prag de semnificaţie  Alegerea unei regiuni critice

    Calcularea valorii observate a parametrului 

    Luarea deciziei 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    5/21

    FORMULAREA PROBLEMELOR ÎN TERMENII IPOTEZELOR STATISTICE

    Definirea ipotezei nule –  testul se desfăşoară subprezumţia că ipoteza nulă ar fi adevărată 

    Definirea diferenţei alternative - numită şi ipoteză delucru –  contrazice ipoteza nulă 

     ALEGEREA PARAMETRULUI STATISTIC  AL TESTULUI

    Parametrul statistic al testului exprimă într-oanumită formă diferenţa dintre elementelecomparate.

    Conceptual, parametrul testului este o variabilăaleatoare de selecţie care urmează o anumitălege de probabilitate

    Este specific fiecărui test statistic în parte 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    6/21

     ALEGEREA PRAGULUI DE SEMNIFICAŢIE 

    Pragul (nivelul) de semnificaţie  reprezintă mărimea  riscului de eroare pe care cercetătorul este dispus să îl accepte, implicit să şi-l asume

    De obicei se alege un nivel de semnificaţie între 1şi 5% 

     ALEGEREA REGIUNII CRITICE 

    Regiunea critică  este un interval sau o reuniunede intervale care specific atât de testului statisticcât şi de nivelul de semnificaţie ales

     (-, -Z]

    [Z

    , +

    )  (-, -Z

    ]  [Z

    , + )

    Constanta Z  se obţine  din tabelele teoretice

    (cunoscute)

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    7/21

    C ALCULAREA PARAMETRULUI 

    Se calculează  valoarea parametrului definit anteriorpe baza datelor de cercetare

    LUAREA DECIZIEI CU  AJUTORUL REGIUNII CRITICE

    H0 este respinsă dacă valoarea parametrului aparţineregiunii critice. În acest caz ipoteza alternativă va fiacceptată, cu un risc de eroare

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    8/21

    CONCLUZIE 

    Prin respingerea ipotezei nule cercetătorul afirmă că rezultatele observate nu sunt datorateîntâmplării = efect semnificativ

    Când ipoteza nulă  nu este respinsă  cercetătorul afirmă  că  diferenţele  observate sunt datorateîntâmplării şi rezultatele nu sunt semnificative

    SEMNIFICAŢIA STATISTICĂ 

    P –  Probability

    Nivelul minim de semnificaţie - teoretic - pentrucare se poate respinge ipoteza nulă 

    Este specific aplicării testelor cu ajutorulsoftware-ului statistic

    P nu reprezintă probabilitatea ca ipoteza nulă săfie adevărată!

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    9/21

    INTERPRETAREA  VALORII P 

    0,01≤ p ≤ 0,05 –  rezultate semnificativ statistice 0,001≤ p < 0,01 –  rezultate înalt semnificativ

    statistice p0,05 –  rezultate nesemnificativ statistice 0,05< p ≤ 0,1 –  tendinţă către semnificaţie

    statistică 

    CONCLUZIE TEST STATISTIC ÎN FUNCŢIE DE SEMNIFICAŢIA STATISTICĂ

    Ipoteza nulă  poate fi negată  dacă  rezultatul testuluiare cel puţin semnificaţie statistică 

    Dacă  rezultatul testului nu are cel puţin  semnificaţie statistică, ipoteza nulă nu poate fi negată 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    10/21

    ERORI ÎN TESTELE STATISTICE 

     Adevăr 

    H0 adevăratăH0Falsă 

    Rezultat

    H0 serespinge

    Eroare tip I(α)

    Corect

    H0 nu serespinge

    Corect Eroare tip II(β)

    EROAREA DE TIP I

    = H0 este respinsă deşi este adevărată  Am concluzionat că există reale diferenţe deşi acestea

    sunt datorate şansei  Concluzionăm că un tratament este eficient pe baza

    unei interpretări greşite 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    11/21

    EROAREA DE TIP II

    = H0 este nu este respinsă deşi este falsă  Am concluzionat că există diferenţele observate

    sunt datorate şansei atunci când acestea apardatorită diferenţelor dintre eşantioane 

     Am putea abandona un tratament pe care tocmaiîl testăm sau o direcţie de cercetare

    “Puterea testului” = 1-probabilitatea apariţieiunei erori de tip II

    TEST STATISTIC  –  MANOPERĂ TEORETICĂ 

    Ca realizare, un test statistic constă  în calculareaunei valori specifice testului (notată cu z, t, F, chi2 etc)cu ajutorul datelor de cercetare, valoare ce se compară 

    apoi cu valorile „critice",  aflate într-un tabel  (valoricunoscute), şi se decide dacă  ipoteza nulă se respingesau nu.

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    12/21

    TEST STATISTIC  –  MANOPERĂ ÎN PRACTICĂ 

    Se utilizează  un software statistic, se alege testulstatistic corespunzător şi se interpretează rezultatul

    TESTE STATISTICE - CLASIFICĂRI 

    Parametrice –  de semnificaţie  Pentru indicatori ai caracteristicilor cantitative – 

    medie, variaţie, coeficient de corelaţie, abaterestandard, etc.

    Neparametrice –  de concordanţă  Pentru caracteristici calitative –  distribuţii de

    frecvenţe, coeficienţi de asociere

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    13/21

    TESTE PARAMETRICE 

     Variabile cantitative –  comparaţii de medii 

    Conceptul de comparaţie este diferit în funcţie dedomeniul de aplicare

    Test unilateral, test bilateral

    MODEL TEORETIC 

     Avem dovezi să afirmăm că două populații suntdiferite din punct de vedere al unui parametru –  cantitativ

    Se poate formula ipoteza ca “din punct de vedereal respectivului parametru, populațiile suntdiferite” sau ” în prima populație parametrul

    respectiv este mai mare decât în a doua” 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    14/21

    IPOTEZELE STATISTICE 

    Ipoteza H0  –  nu există diferenţă semnificativstatistică între cele două medii 

    Ipoteza alternativă test bilateral H1 –  cele douămedii sunt semnificativ diferite

    Ipoteza alternativă test unilateral H1  –  unadintre medii este semnificativ mai mare decâtcealaltă 

    IPOTEZE STATISTICE  –  FORMULARE MATEMATICĂ

     0: :00

       B A B A

      H  sau H        

     0: :11

       B A B A

      H  sau H        

     0: :11

       B A B A

      H  sau H        

     0: :11

       B A B A

      H  sau H        

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    15/21

    REGIUNE CRITICĂ 

    Pentru test bilateral –  reuniune de intervale(-, -Z

    ]  [Z

    , + )

    Pentru testul unilateral(-, -Z

    ] sau [Z

    , + ) –  în funcţie de direcţia de

    comparaţie 

    C ATEGORII TESTE PARAMETRICE 

    Teste de tip Z

    Teste de tip T

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    16/21

    TESTE DE TIP Z

    Condiţii de aplicare 

    Populaţie normal distribuită  Variaţia în populaţie este cunoscută, sau cel puţin

    poate fi estimată Eşantioane mari –  mai mari de 30 de persoane

    TIPURI DE TESTE Z

     Comparaţia mediei unui eşantion cu media uneipopulaţii 

    Comparaţia mediilor a două populaţii 

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    17/21

    EXEMPLU 1

    Se cunoaşte  că  media taliei normale a nou-născuţilor  la termen este de 51 cm. Pe uneşantion  reprezentativ de 49 nou-născuţi prematur se observă o medie a taliei de 45 cm cuo variaţie  de eşantionare  egală  cu 9. Diferenţaîntre cele două  medii este semnificativă?  Adică, se poate afirma că  prematurii se nasc cu o taliemai mică decât nou-născuţii la termen?

    REZOLVARE (1)

    Ipoteza nulă H 0 : In ceea ce priveşte talia lanaştere nu există o diferenţă semnificativă întretalia prematurilor şi cea a nou născuţilor latermen.

    Ipoteza alternativă H 1: In ceea ce priveşte talia lanaştere EXISTĂ o diferenţă semnificativă între

    talia prematurilor şi cea a nou născuţilor latermen.

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    18/21

    REZOLVARE (2)

    Parametrul testului este

    U=

     Alegem pragul de semnificaţie α = 0,05, regiuneacritică va fi (-, -1,96]  [1,96, + )

    n

    m

      

      

    REZOLVARE (3)

    Pentru datele de cercetare parametrul U are valoarea

    =51 − 45

    9

    49

    =67

    9  = 4,66 

    4,66>1,96, deci U aparţine regiunii critice, deci ipotezanulă H0 se poate respinge cu un risc de eroare de speţaI < 0,05

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    19/21

    CONCLUZIE 

    Talia prematurilor este în medie semnificativ

    diferită (mai mică) decât cea a nou născuţilor la

    termen. Afirmând acest lucru există o

     probabilitate mai mică de 5% de a face o eroare. 

    EXEMPLU 2

    Se doreşte  să  se studieze dacă  există  diferenţă semnificativ statistică  între nivelul seric almagneziului la persoanele emigrate dinRepublica Moldova în România. Se cunoaşte faptul că  nivelul seric al magneziului urmează legea normală  cu o variaţie  de 1 mg/100ml lapersoanele din România, respectiv cu o variaţie de 2,3/100ml la persoanele din Moldova.

    Nivelul mediu al magneziului seric, obţinut la uneşantion de 120 de persoane din România a fost 2mg/100 ml în timp ce la măsurătorile pe un grupde 80 de persoane emigrate din RepublicaMoldova a rezultat un nivel mediu de2,5mg/100ml

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    20/21

    REZOLVARE (1)

    Ipoteza nulă H 0 : In ceea ce priveşte nivelul serical magneziului la persoanele emigrate dinRepublica Moldova în România nu există diferenţă  semnificativ statistică  faţă  depersoanele născute în România

    Ipoteza alternativă H 1: In ceea ce priveşte nivelulseric al magneziului la persoanele emigrate dinRepublica Moldova în România EXISTĂ diferenţă  semnificativ statistică  faţă  de

    persoanele născute în România

    REZOLVARE (2)

    În acest caz parametrul este

    =  −

     Alegem pragul de semnificaţie α = 0,05, regiunea critică vafi (-, -1,96]  [1,96, + )

  • 8/17/2019 7-Testarea Ipotezelor Statistice. Teste de Medie

    21/21

    REZOLVARE (3)

    Utilizând datele de cercetare obţinem 

    =2 − 2,5

    1

    120 +

     2,3

    80

    = −2,59 

    -2,59