27
Introduksjon til statistikk 21.08.2006 Knut Reidar Wangen Statistisk sentralbyrå ([email protected] ) Institutt for helseledelse og helseøkonomi ( [email protected] ) Trefftid: Mandager. Avtale per e-post

Introduksjon til statistikk

  • Upload
    eben

  • View
    41

  • Download
    0

Embed Size (px)

DESCRIPTION

Introduksjon til statistikk. 21.08.2006 Knut Reidar Wangen Statistisk sentralbyrå ( [email protected] ) Institutt for helseledelse og helseøkonomi ( [email protected] ) Trefftid: Mandager. Avtale per e-post. Noen praktiske ting først:. Web-side for kurs:. - PowerPoint PPT Presentation

Citation preview

Page 1: Introduksjon til statistikk

Introduksjon til statistikk

21.08.2006Knut Reidar Wangen

Statistisk sentralbyrå ([email protected])Institutt for helseledelse og helseøkonomi ([email protected])

Trefftid: Mandager. Avtale per e-post

Page 2: Introduksjon til statistikk

Noen praktiske ting først:

• (http://www.uio.no/studier/emner/medisin/helseadm/HSTAT1101/h06)

• Detaljert undervisningsplan• Opplysning om viktige datoer (prøveeksamen,

eksamen…)• Beskjeder (for eksempel avlyst undervisning…)

Web-side for kurs:

Page 3: Introduksjon til statistikk

Pensum/lærekrav:

• Aalen, O.O. et al.: Statistiske metoder i medisin og helsefag. 2006. Gyldendal.

• Pensum er endret. Tidligere utgave var Aalen, O.O.: Innføring i statistikk, 2. utgave. 1998. Gyldendal.

• ”Pensum er også annet stoff som gjennomgås i forelesninger og øvelser. Utskrifter fra statistikkprogrammet SPSS må kunne fortolkes innenfor de rammene som er gitt i undervisningen.”

Page 4: Introduksjon til statistikk

Undervisning:

• Forelesninger: Mandag 09:15-11:00, Harald Schjeledrups hus, seminarrom 1

• Seminar/PC-øvinger: Mandag 14:15-16:00. – Seminar holdes i Harald Schjelderups hus, seminarrom

1– PC-øvinger holdes i Domus Medica, PC-stue i 2.

etasje. (Sjekk detaljert undervisningsplan på kurssiden!)

• OBS! Ingen undervisning uke 39 (25. september)

Page 5: Introduksjon til statistikk

• Prøveeksamen – Deles ut på forelesning 30. oktober– Innlevering før 6. november kl. 11:00– Gjennomgang 13. november på seminar

• Eksamen 11. desember

Page 6: Introduksjon til statistikk

Introduksjon

• Hvorfor bør (må?) dere lære statistikk?– Statistikk brukes i mange fag: Medisin, økonomi, fysikk, kjemi,

biologi, sosiologi, kryptografi, språkvitenskap, arkeologi osv.– Vi overøses med statistikk eller forskning basert på statistikk

• ”Norge er det eneste landet i verden som aldri har tapt mot Brasil i fotball” (16. august 2006, Fotballkommentator)

• ”4.660.000 bor nå i landet” (17. august 2006, Aftenposten/SSB)• ”Nå er også hvitvin sunt” (17. august 2006, Aftenposten/Forskning.no)• ”Selvdisiplin gir gode karakterer”. Betydningen av selvdisiplin var

dobbelt så stor som betydningen av elevenes intelligens for eksamensresultatet… (17. august 2006, Aftenposten/Amerikansk studie, ca 300 barn 14-15 år)

Page 7: Introduksjon til statistikk

• Hva er bra med statistikk?– Kan forenkle en kompleks datasituasjon (for oss selv

eller andre). Datareduksjon– Kan gi bedre forståelse av beslutningsproblemer med

usikkerhet– Motvekt til overtro. Eks: Hvis myntknipsing gir kron 5

ganger på rad – hva er sannsynligheten for å få kron neste gang?

Page 8: Introduksjon til statistikk

Deskriptiv/beskrivende statistikk

• Mål: Summere opp data. Redusere datamengden. Rendyrke relevant info– ”Nøkkeltall” og tabeller. Eks: Gjennomsnitt,

maksimum, minimum, standardavvik, …– Grafikk. Eks: Histogram, plot, tidsserier,…

Page 9: Introduksjon til statistikk

Eksempel på datareduksjon• Originaldata:

Page 10: Introduksjon til statistikk

• Oppsummering av data:

Page 11: Introduksjon til statistikk

• Visualisering (hyppighet):

Page 12: Introduksjon til statistikk

• Visualisering (Kummulativ relativ hyppighet):

Page 13: Introduksjon til statistikk

Hva er det typiske i et datasett? Mål for sentrum

• Gjennomsnitt

• Median– Faktisk midterste verdi hvis antall

observasjoner er et oddetall– Hvis antall observasjoner er et partall, så er

det gjennomsnittet av de to midterste

Page 14: Introduksjon til statistikk

• Gjennomsnitt versus median– Avhenger av form på fordeling. Eks: ”tung”

høyre hale gir Gjennomsnitt < Median– Median mindre følsom for ekstreme obs.

– Formål kan avgjøre relevans

Page 15: Introduksjon til statistikk

Variasjonen i en fordeling. Spredningsmål

• Eks: 2 fordelinger, likt gjennomsnitt, ulik spredning

• Empirisk varians

• Empirisk standardavvik

Page 16: Introduksjon til statistikk
Page 17: Introduksjon til statistikk

• Range. Avstand mellom maksimum og minimum

• Avstand mellom fraktiler– En fraktil angir et nivå slik at en gitt fraksjon

av data har verdier under dette nivået• Eks. Median er 50% persentilen• 60% persentilen er nivået som 60% av data ligger

under• Første kvartil er det nivået som 25% av data ligger

under

– Eks: Avstand mellom 10% og 90% fraktilene

Page 18: Introduksjon til statistikk

Grupperte (kontinuerlige) data

• Når man ikke har tilgang til opprinnelige data– Eks: Individuelle data er sensitive og

upublisert, mens gruppegjennomsnitt er tilgjengelig

– Eks: Individer kan være uvillige eller ute av stand til å svare eksakt, men villige/i stand til å opplyse om intervall (inntekt, alder?)

Page 19: Introduksjon til statistikk

• Gruppert gjennomsnitt

Page 20: Introduksjon til statistikk
Page 21: Introduksjon til statistikk

• Gruppert empirisk varians/standardavvik

• Gruppert median

Page 22: Introduksjon til statistikk

Kategoriske data• Gruppering av

observasjoner uten

naturlig gitt ordning – Søylediagram– Kakediagram

Page 23: Introduksjon til statistikk
Page 24: Introduksjon til statistikk

Tidsserier• Plot av en (eller flere) variable over tid

Page 25: Introduksjon til statistikk

Sammenligning av grupper

Page 26: Introduksjon til statistikk

Beskrivelse av samvariasjon

Page 27: Introduksjon til statistikk

Årsakssammenheng?