Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

  • Upload
    user94

  • View
    256

  • Download
    1

Embed Size (px)

Citation preview

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    1/40

    1 11

    (Master)

    Ligjerata 5

    Metodologjia hulumtuese

     Analiza e të dhënave

    Prof.asc. Avdullah Hoti

    2013/14

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    2/40

    Literatura për këtë ligjëratë

    ‘Research methods for Business Students’, Saunder,M., Lewis, P. And Thornill, A., Pearson EducationLimited, Essex, 2009 Kapitulli 12, faqe 414-479

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    3/40

    Përmbatja

    a) Analiza e të dhënave statistikore1. Mesatarja

    2. Treguesit e pozicionit: moda dhe mediana

    3. Treguesit e variacionit: varianca; devijimistandard; koeficienti i variacionit

    4. Indekset

    5. Matësit e ndërlidhjeve në mes të variablave:kovarianca dhe koeficienti i korelacionit

    b) Teknikat përshkruese të të dhënavec) Interpretimi i të dhënave

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    4/40

    a) Analiza e të dhënave

    4.4

    Analiza e të dhënave: Për të prodhuar tregues statistikor përmes të cilëve

    nxjerren përfundime cilësore për dukurinë e studiuar.

    Analiza statistikore statike: hulumtimi i dukurisë në një moment të caktuar.

    Analiza dinamike: hulumtimi i dukurisë nëpër kohë; ndryshimi i

    variablave/ndryshoreve nëpër kohë

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    5/40

    Analiza e të dhënave

    1. Mesatarja 

    1. Mesatarja aritmetike e thjeshtë për të dhënat e pagrupuara

    2. Mesatarja aritmetike e ponderuar

    për të dhënat e grupuara/frekuenca

    3. Mesatarja aritmetike nga të dhënat eshprehura në interval

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    6/40

    Mesatarja aritmetike e thjeshtë

    Popullacioni Mostra

    6; _ 16

    654321

    nnderii

     x x x x x x x

    Është adekuate për të përshkruar të dhënat sasiore

    Është e ndikuar nga vlerat ekstreme (outliers). Shembull:

    Nëse nr mesatar i punëtorëve për firmë është 20.

    në sektor hynë një firmë e re që punëson 1000 punëtorë menjëherë,

    rritet numri mesatar i punëtorëve për firmë

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    7/40

    Mesatarja aritmetike e ponderuar

    Raporti i shumës së fituar nga shumëzimi i të dhënaveme frekuencat e tyre, pjestuar me numrin total tëfrekuencave

      frekuencat   f   

      f     f     f     f     f     f   

      f    x  f    x  f    x  f    x  f    x  f    x x

    654321

    665544332211

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    8/40

    Mesatarja aritmetike nga të dhënat interval

    Të dhënat shprehen në intervale ngase: Më praktike:

    mosha; vitet në shkollimi

    Konfidencialiteti:

    për të mbrojtur privatësinë sot ligje për formën e pyetjeve tështruara në pyetësor: shitjet, të ardhura personale

    Mesatarja llogaritet si mesi i intervalit

    Për kufirin e ultë dhe të lartë merret vlera e shënuar ose

    inspektohen të dhënat.

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    9/40

    Cilësitë e mesatares aritmetike

    Renditja e të dhënave nuk ndikon në mesatarenaritmetike

    Shuma e shmangieve të të dhënave individuale nga

    mesatarja është baraz me zero Barazohen shmangjet pozitive me ato negative të

    observimeve individuale ndaj mesatares

     Zvogëlimi, zmadhimi, shumëzimi apo pjestimit i të

    gjtha observimeve me një madhësi konstante (a),rezulton me të njejtin efekt në madhësinë e mesatares

    aritmetike. 

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    10/40

    2. Treguesit e pozicionit Dy tregues të pozicionit

    Moda: observimi me frekuencën më të lartë (që paraqitet më sëshpeshti) Nota më e shpeshtë, sëmundja më e shpeshtë, lloji më i shpeshtë i

    aksidenteve

    Mediana: mesi i serisë Observimet ‘tek’: {35,34,38,40,37,33,28,36,39}, N=9, (N+1)/2

    Listo min-to-max: {28, 33, 34, 35, 36, 37, 38, 39, 40} = (9 + 1)/2=5

    i pesti vrojtim në renditje = 36

    Observimet ‘qift’: {19,12,19,26,28,22}, N=6, (N+1)/2 Listo min-to-max: {12,16,19,22,26,28}=(6+1)/2=3.5

    Vrojtimet 3 dhe 4 = 19 dhe 22

    mediana = (19+22)÷2 = 41/2=20.5

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    11/40

    2. Treguesit e pozicionit

    Mesi i serisë: (min+max)/2

    Por, problem kur ka vlera ekstreme (outliers) Shembull:

    90% e të punësuarve kanë pagë prej 200-500 euro në

    muaj, 7% kanë pagë 501-800 euro në muaj

    2% kanë pagë 801-1100 euro në muaj

    1% kanë pagë 10,000 euro në muaj

    Mesatarja trimmedE dizajnuar për të evituar efektin e vlerave ekstreme

    Gjendet mesatarja aritmetike pas heqjes së vleraveekstreme

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    12/40

    3.Treguesit e variacionit

    4.12

    Matësit e lokacionit mesatar nuk tregojnë gjendjen e pltoë

    për shpërndarjen e të dhënave rreth qendrës/mesatares

    Shembull:

    • Dy grupe studentësh me

    nga 50 studentë• Rezultati mesatar në testin

     A = 50% për të dy grupet:

    • Pra mesatarja ekalueshmërisë është

    e njëjtë për dy grupet• Por klasa me të kuqe ka më

    shumë variacion në rezultatse klasa me të kaltër.

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    13/40

    3.Treguesit e variacionit… 

    Gjërësia e variacionit  

    Treguesi me i thjeshtë i variacionit= vrojtimi me vlerën më të lartë (maksimale) – vrojtimi

    me vlerën më të vogël (minimale)

    Shembull Të dhënat: {4, 4, 4, 4, 50} Range = 46

    Të dhënat : {4, 8, 15, 24, 39, 50} Range = 46

    Lehtë llogaritet

    E metë kryesore: pamundësia për të ditur shpërndarjen etë gjitha vrojtimeve në mes min dhe max

    Andaj më informues matësi i variacionit që përfshin tëgjitha të dhënat e jo vetëm vlerat minimale dhe

    maksimale.

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    14/40

    3. Treguesit e variacionit 

    4.14

    Varianca (shmangia mesatare kuadratike)

    paraqet madhesine mesatare te diferencave absolute ne mes temesatares aritmetike dhe vlerave individuale te serise statistikore.

    Llogarit mesataren aritmetike

    Seritë e thjeshta:

    Llogarit devijimin e secilit vrojtim nga mesatarja,

    të gjitha në katror, dhe

    shumën e devijimeve e pjeston me numrin e vrojtimeve.

    Seritë e ponderuara:

    Llogarit devijimin e secilit vrojtim nga mesatarja,

    të gjitha në katror,

    shumëzo me numrin e frekeuncave përkatëse dhe

    shumën pjesto me numrin e frekuencave.

    2

    2 1

    ( )n

    i

    i

     X X 

    n

       

    2

    2 1

    ( )n

    i

    i

    i X X 

    i  

     

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    15/40

    3. Treguesit e variacionit

    4.15

    Devijimi standard

    Është rrënja katrore e variancës Përdoret për të krahasuar variacionin e distribuimeve dhe

    formën e distribuimit.

    Nëse histogrami ka formën e ziles atëherë, rregulla empirike:

    Rreth 68% e të gjitha observimeve gjinden brenda 1 devijimistandard nga mesatarja.

    Rreth 95% e të gjitha observimeve gjinden brenda 2devijimeve standarde nga mesatarja.

    Rreth 99.7% e të gjitha observimeve gjinden brenda 3devijimive standarde nga mesatarja.

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    16/40

    3. Treguesit e variacionit

    4.16

    Devijimi standard: Interpretimi

    Sa më i vogël, observimet janë më afërmesatares aritmetike.

    Rreth 68% e të gjitha observimeve gjinden

    brenda 1 devijimi standard nga mesatarja.

    Rreth 95% e të gjitha observimeve gjinden

    brenda 2 devijimeve standarde nga mesatarja.

    Rreth 99.7% e të gjitha observimeve gjinden

    brenda 3 devijimeve standarde nga mesatarja.

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    17/40

    3. Treguesit e variacionit

    Devijimi standard: Interpretimi Mesatarja e shpenzimeve telefonike 14 euro

    Devijimi standard 4 euro

    Bazuar në “Rregullën empirike”  rreth 68% e personave shpenzojnë në mes të (14-4) dhe

    (14+4)=10-18 euro

    Rreth 95% e personave shpenzojnë në mes të (14-4*2)

    dhe (14+4*2)=6-22 euro Rreth 98% e personave shpenzojnë në mes të (14-4*3)

    dhe (14+4*3)=2-26 euro

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    18/40

    3. Treguesit e variacionit

    Koeficienti i varicionit:

    Devijimi standard pjestuar me mesataren:

    Shpreh shmangiet mesatare të vrojtimeve në % ngamesatarja aritmetike.

    Sa më homogjene të dhënat, aq më i vogël Kv

    Devijimi standard prej 10 mund të konsiderohet i

    lartë kur mestarja është 100, por jo shumë i lartë nëse mesatarja është 500,

    andaj koeficienti i variacionit eshte tregues më i qartë

    100 Kv X 

      

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    19/40

    4. Indekset

    Për studimin e dinamikës së dukurive dhekrahasimin në mes tyre përdoren treguesitrelativ indekset

    Llojet e indekseve Indekset bazë

    Indekset zinxhir

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    20/40

    4. Indekset:

    Bazë

    Raporti i nivelit të serisë kohore ndaj nivelit apomadhësisë së asaj serie të zgjedhur si bazë konstante.

    Baza: Seria bazë N1

    I1

    ={(N2

    /N1

    )*100}-100

    I2={(N3/N1)*100}

    Mbetja pozitive nënkupton rritje në krahasim me serinëbazë

    Mbetja negative nënkupton rënie në krahasim me serinëbazë

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    21/40

    4. Indekset

    Zinxhirore Shprehin raportin e secilës seri raportuese ndaj

    madhësisë/serisë paraprake si bazë

    Vargore-zinxhirore ngase nivelet e serisë kalojnë prejpozitës raportuese në pozitën e bazës së indeksit

    pasardhës Baza e llogaritjes së indekseve ndryshon

    I1=(N2/N1)*100; I2=(N3/N2)*100; I3=(N4/N3)*100

    Interpretimi në raport me periudhën paraprake =100 i pandryshuar;

    mbi 100 rritje dhe

    nën 100 rënie

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    22/40

    5. Treguesit e ndërlidhjeve në mes të

    variablave

    4.22

    Fuqia dhe drejtimi i lidhjeve lineare në mes tëdy variablave (nëse egziston ndërlidhja).

    Kovarianca – a egziston ndonjë ndërlidhje në

    lëvizjen e dy variablave? Koeficienti i korelacionit  – sa e fortë është

    ndërlidhja në mes dy variablave?

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    23/40

    5. Matësit e ndërlidhjeve në mes të variablave:

    Kovarianca

    4.23

    Mesatarja e variablës X dhe e Y

    Kur dy variabla lëvizin në të njejtin drejtim,kovarianca është pozitive. 

    Kur dy variabla lëvizin në drejtime të kundërta,kovarianca është negative.

    Kur nuk egziston kurrfarë lidhjekovarianca është numër i vogël.

    5 M ë i dë lidhj ë ë i bl

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    24/40

    4.24

    • Tri sete: X dhe Y të njejta, ndryshon renditja e YSet 1: me rritjen e X rritet Y, Sxy pozitive dhe e lartëSet 2: me rritjen e X bie Y, Sxy negative dhe e lartë

    Set 3: me rritjen e X nuk ndyrshon Y, Sxy ulët

    5. Matësit e ndërlidhjeve në mes të variablave:

    Kovarianca

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    25/40

    4.25

    Definohet si kovariancë pjestuar me devijimin standard tëtë dy variablave:

    • Koeficienti tregon sa e fortë është ndërlidhja në mes të

    X and Y?

    • Nëse mbi 0.5 lidhja e fortë

    • Merr vlera nga 0 deri 1

    • Nëse dy variabla janë të lidhura pozitivisht,

    koeficienti do të marrë vlerë afër +1

    • Nëse dy variabla janë të lidhura negativisht,

    koeficienti do të marrë vlerë afër -1

    5. Matësit e ndërlidhjeve në mes të variablave:

    Koeficienti i korelacionit

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    26/40

    4.26

    r  ose r =

    +1

    0

    -1

    Lidhje pozitive

    Nuk egziston ndonjë lidhje

    Lidhje negative

    5. Matësit e ndërlidhjeve në mes të variablave:

    Koeficienti i korelacionit

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    27/40

    4.27

    Shembull Kovarianca 26.16

    koeficienti i korelacionit 0.5365

    Shpjegimi: Egziston lidhje pozitive në mes të dy

    variablave të studiuara (kovarianca)

    Ndërlidhja e variablave është mesatarisht efortë (koeficienti i korelacionit)

    5. Matësit e ndërlidhjeve në mes të variablave:

    Koeficienti i korelacionit

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    28/40

    Simbolet në statistikë

    4.28

    Popullacioni Mostra

    Madhësia  N n

    Mesatarja

    Varianca S2

     Devijimi

    StandardS

    Koeficienti i

    variacionit CV cvKovarianca Sxy 

    Koeficienti i

    korelacionitr

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    29/40

    b) Teknikat përshkruese të tëdhënave 

    Statistika është mënyrë e përfitimit tëinformacioneve nga të dhënat

    Përshkrimi i të dhënave për:  Për raportime

     Udhëzojnë për analiza të mëtutjeshme

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    30/40

    Paraqitja tabelare dhe grafike

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    31/40

    Paraqitja e statistikave të dy variablave

    Cross tabulation-tabulimi për të shpjeguar marrëdhënien në mes

    dy variablaveNjë mostër e lexuesve të gazetave të pyetur se cilat gazeta ata lexojnë: Globe andMail (1), Post (2), Star (3), ose Sun (4), dhe të shënojnë nëse ata janë punëtorë të

    pashkolluar (1), të shkolluar (2), ose professional (3). 

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    32/40

    Grafiket per lidhjen ne mës te dy variablave

    2.32

    Profesionalistet

    tentojne te lexojne

    me shume Globe &

    Mail dy here me

    shume sesa Star ose

    Sun… 

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    33/40

    Diagramet

    Sa më e madhe shtëpia më i shtrenjtë cmimi i shtëpisë… 

    Zakonisht dukuritë dinamike

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    34/40

    Diagramet scatter

    2.34

    Lidhje pozitive Lidhje negative

    Lidhje e dobet ose nuk egziston lidhje

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    35/40

    c) Interpretimi i të dhënave

    Përmbledh çështjet kyçe që dalin ngatabela (ne vend te shih Tabelen X)Evito tendencën për të raportuar të

    gjitha shifrat në tabelë ose grafikë

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    36/40

    36

     Në vitin 1986, eksplodimi i anijes kozmike, ku 7

    astronautë kanë vdekur, është shembulli më i mirë ikomunikimit të dobët të numrave. Një natë para se tënisej, u udhëzua të mos nisej anija për shkak tëtemperaturave të ulta që do të dëmtonin disa pjesë të

    anijes. Grafikët e pregatitur në nxitim u fokusuan nëinformata selektive (ndikimi i temperaturave të ulta)duke harruar informata të rëndësishme. NASA (The

     National Aeronautics and Space Administration) nuk u

     bind nga argumentet dhe anija u lëshua duke eksploduar brenda 7 sekondave.

    c) Interpretimi i të dhënave

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    37/40

    2.37

    Prej vitit 1993 deri ne vitin 2001 në Amerikë kishte rritje të

    madhe të të hyrave nga tatimet, kur edhe filloi rënia.

    c) Interpretimi i të dhënave

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    38/40

    Reth gjysma e faturave (71+37=108)Janë të “vogla”, Më pak se $30

    Janë vetëm disa faturatelefonike të madhësisë

    mesatare.

    Rretj 1/3 e telfonatave janë$90 e më shumë

    c) Interpretimi i të dhënave

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    39/40

    Disa rregulla për paraqitjen e të dhënave

    në tabela dhe grafikë

    39

    Para tabelës ose diagramëve njofto lexuesin me tabelë: konkludimin e nxjerrë nga tabela

    Seksioni/kapitulli nuk përfundohet me tabelë

    Titulli i tabelës: periudha, njësia matëse Burimi i të dhënave Rrumbullakso vlerat (249,567 sheno si 250,000) Të dhënat që krhasohen vendosi afër

    Vijat nëpër tabelë pengojnë krahasimin. Vendos vlerat në të djathtë Evitoni shkurtesat Totali

  • 8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l

    40/40

    Shembull.1

    Duke përdorur të dhëna për një problemhulumtues me interes për ju, llogaritni:

    a) Mesatarën

    b) Moda dhe medianac) Gjeresia e variacionit

    d) Shmangia mesatare absolute

    e) Variacionif) Devijimi satandard,dhe

    g)