39
Matthias Engberg Eiriksson Nu: DONG Energy Før: Danmarks Statistik og Det Informationsvidenskabelige Akademi 1 Statistisk Informationssøgning Gentofte Bibliotek 31. januar 2013

Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Embed Size (px)

DESCRIPTION

Slides fra kursus i Statistisk Informationssøgning på Gentofte Centralbibliotek 31-01-2013

Citation preview

Page 1: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Matthias Engberg Eiriksson

Nu: DONG Energy

Før: Danmarks Statistik og Det Informationsvidenskabelige Akademi1

Statistisk InformationssøgningGentofte Bibliotek31. januar 2013

Page 2: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

09.00-09.15 Velkomst og forventningsafstemning

09.15-09.45 Statistiske grundbegreber

09.45-10.15 Faldgruber

10.15-10.30 Pause

10.30-11.30 Danmarks Statistiks publikationer og hjemmeside

11.30-12.00 Referenceinterviewet

12.00-12.45 Frokost

12.45-14.00 Statistikbanken

14.00-14.30 Pause

14.30-15.15 Øvrige kilder til dansk statistik

15.15-15.30 Evaluering og afslutning

2

Page 3: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Hvad er statistik? Metodisk, videnskabelig baseret

indsamling og bearbejdning af data

med henblik på formidling af viden om

et emne

Hvorfor statistik? Formålet med statistik er ikke i sig selv

at indsamle data, men at forsyne

nogen med information.

Resumé af samfundet

Grundlag for debat og forskning

Tilgængelighed er demokratisk ret

3

Page 4: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Population

udgøres af elementer, der har en eller flere egenskaber til fælles

Element

individ

enhed (fx familie, region, firma)

Egenskab

observation/variabel (fx alder, indkomst, højde, omsætning)

Kvantitative undersøgelser

fakta

Kvalitative undersøgelser

holdninger

4

Statistiske grundbegreber – opsamling

Page 5: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Totaltælling

alle elementer i en population

Stikprøve

tilfældigt udvalgte elementer i en population

Gennemsnit

mean – aritmetisk gennemsnit

Typetal

modus – den oftest forekommende værdi

Median

den midterste værdi

Fraktiler

fx 25%, 50% og 75%

5

Statistiske grundbegreber – opsamling

Page 6: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

There are three kinds of lies: lies, damned lies, and statistics

(Benjamin Disraeli, Britisk Premier minister)

6

Faldgruber i statistikken

Page 7: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

En virksomhed har 6 medarbejdere:

4 tjener 12500 kr. om måneden

1 tjener 14000 kr. om måneden

1 tjener 26000 kr. om måneden

Hvad er gennemsnitslønnen i virksomheden?

7

Snyd med gennemsnit

Page 8: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

8

Intervaller

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

0-18 19-40 41-100 0-35 36-59 60-100 0-23 24-46 47-100

Indbyggertallet i Aarhus

Page 9: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

9

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

0 å

r

2 å

r

4 å

r

6 å

r

8 å

r

10 å

r

12 å

r

14 å

r

16 å

r

18 å

r

20 å

r

22 å

r

24 å

r

26 å

r

28 å

r

30 å

r

32 å

r

34 å

r

36 å

r

38 å

r

40 å

r

42 å

r

44 å

r

46 å

r

48 å

r

50 å

r

52 å

r

54 å

r

56 å

r

58 å

r

60 å

r

62 å

r

64 å

r

66 å

r

68 å

r

70 å

r

72 å

r

74 å

r

76 å

r

78 å

r

80 å

r

82 å

r

84 å

r

86 å

r

88 å

r

90 å

r

92 å

r

94 å

r

96 å

r

98 å

r

100 å

r

Alder

Indbyggertallet i Aarhus

Page 10: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

10

Grafer og akser

0

500

1000

1500

2000

2500

3000

2006 2007 2008 2009

Svinebedrifter 2006-2009

Jævn udvikling?

Page 11: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

11

Grafer og akser

1700

1800

1900

2000

2100

2200

2300

2400

2500

2006 2007 2008 2009

Svinebedrifter 2006-2009

Kraftigt fald?

Page 12: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

12

Årsagssammenhæng?

Page 13: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

13

Selektiv udvælgelse af data (cherry-picking)

Page 14: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Andre faldgruber

Ændringer i metode

Kommunalreform

Arbejdstidsregnskab

Forstår vi begreberne?

Ægtepar: 1 027 135

Andre par: 308 969

Reg. partnerskaber: 4 101

Samlevende par: 110 050

Samboende par: 194 818

14

Page 15: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Fejlkilder - eksempler

Små stikprøver – fx kliniske tests i

reklamer

Folk kan være karrige med sandheden –

bevidst eller ubevidst

Fx om hvor meget de går i teateret:

Eller om prostitution:

15

Page 16: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Opsamling

Troværdig statistik

skal være alsidig og upartisk

skal have høj kvalitet, dvs. den skal være

relevant, pålidelig, aktuel, sammenhængen

de og let tilgængelig

skal udarbejdes på et videnskabeligt

grundlag

Hold øje med:

Afsenderens troværdighed – hvilke

interesser ligger der bag?

Stikprøvens størrelse – hvis N<1000 bør

man være forsigtig med konklusionerne

Bliver der "snydt" med akser og

intervaller?

Får man adgang til detaljerede

oplysninger? – Et simpelt gennemsnit kan

dække over en stor skævhed

16

Page 17: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Mission:

Danmarks Statistik udarbejder upartisk statistik om samfundet som grundlag for

demokratiet og samfundsøkonomien

Opgave:

Danmarks Statistik indsamler, bearbejder og offentliggør statistiske oplysninger om

samfundet, evt. i samarbejde med andre statistikproducenter. Herudover

udarbejder vi statistiske analyser og prognoser.

17

Danmarks Statistik

Page 18: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Gratis:

"Spørg biblioteket"

En stor del af online-publikationerne

Statistikbanken

Mod betaling:

Kundecenter

Papir-publikationer

Enkelte onlinepublikationer

Betalingsdatabanken

18

Danmarks Statistiks services

Page 19: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks statistikker

Registerbaseret statistik:

Det Centrale Personregister (CPR)

Det Centrale Virksomhedsregister (CVR)

Bygnings- og Boligregisteret (BBR)

Kriminalregisteret

Statistik som er indsamlet via tællinger

eller undersøgelser/stikprøver

Arbejdskraftundersøgelsen (AKU)

Regnskabsstatistik

Primært statistik baseret på lovkrav

(danske eller fra EU)

Enkelte statistikker laver man "for

sjov", fx navnestatistikken

Det finder man ikke hos Danmarks

Statistik:

Meningsmålinger

Religion

Handicap

Seksualitet

Mobning

Sort arbejde

Prostitution

19

Page 20: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks publikationer – Nyt fra Danmarks Statistik

Nyt fra Danmarks Statistik

Korte præsentationer af de nyeste

statistikker

Kommer næsten dagligt

Lettilgængeligt, medievenligt format

En god indgang til de lidt mere

komplicerede tabeller i statistik-

banken

Gratis

www.dst.dk/nyt

20

Page 21: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks Publikationer – Statistisk Årbog

Statistisk Årbog

Danmarks Statistiks flagskib

Statistik om alt mellem himmel og jord

Udgivet siden 1896 – alle udgivelser er

tilgængelige online via

www.dst.dk/aarbog

Gratis online – papirudgave mod betaling

Findes også på engelsk

21

Page 22: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks Publikation – Statistiske Efterretninger

Statistiske Efterretninger

Den kommenterede og uddyb-

ende formidling om statistiske

serier

Udkommet siden 1909 – online fra

fra 1999 og frem

Mod betaling – abonnement

www.dst.dk/efterretninger

22

Page 23: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks publikationer – Statistisk Tiårsoversigt

Tiårsoversigten er Danmarks Statistiks

mest populære bog

Udkommer årligt med et nyt tema.

Med et systematisk overblik over ti års

samfundsudvikling er bogen velegnet

til undervisning

Ikke online – men bør findes på

ethvert folkebibliotek!

Tilsvarende findes også 50-års

oversigten fra 2001 og 60 år i tal fra

2008

23

Page 24: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Danmarks Statistiks statistikker er inddelt i 13 forskellige overordnede emner:

24

Danmark Statistiks hjemmeside – www.dst.dk

Page 25: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

25

Danmarks Statistiks hjemmeside – www.dst.dk

Page 27: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Referenceinterviewet

27

Page 28: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Hvad er emnet? – Og hvad er det bagvedliggende informationsbehov?

Hvad skal det bruges til?

Hvilket niveau?

Hvad skal der til for at tilfredsstille brugerens behov?

Hvilket tidsinterval skal statistikken dække?

Hvilke enheder og hvilke egenskaber (variable) er brugeren interesseret i?

Problemer:

statistik tager tid – de fleste brugere vil have statistik om i går i dag. Mange statistikker

tager op mod et år at gøre klar.

Statistik er svært – ofte kan man nøjes med en Nyt eller Årbogen

28

Referenceinterviewet

Page 29: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Statistikbanken

Statistikbanken indeholder i detaljeret

form officiel statistik, som beskriver det

danske samfund.

Den er gratis at bruge og data kan

gemmes i mange filformater og vises

som diagrammer eller landkort.

Relativt enkel at gå til – men med

mange avancerede muligheder

Vi genkender emnerne fra dst.dk:

I hver tabel skal man selv vælge hvilke

variable, man er interesseret i – det

kan fx i befolkningsstatistikken være

kommune, alder, køn.

29

Page 30: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Statistikbanken – sådan gør man

Klik ned gennem emnehierarkiet til

du finder den rigtige tabel

Klik på tabellen for at åbne den

Marker de variabler, du vil have

med

Klik på Vis tabel

Herfra kan du gemme dine tal i fx

Excel

Eller få vist som diagram eller

lignende

30

Page 31: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Man kan bruge Ctrl-knappen til at vælge flere variable

I rullegardinet Flere valgmuligheder kan bl.a. sortere variablerne og vælge

specielle summeringer (fx aldersgrupper)

Nogle variable er det obligatorisk at vælge i (fx år), andre kan man undlade

Klik på fanebladet Information for at finde

kontaktperson, kvalitetsdeklaration, begreber og relaterede publikationer

Geografisk opdelte tabeller kan vises på kort

31

Statistikbanken – opmærksomhedspunkter

Page 32: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Andre kilder til statistik

32

Page 33: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

En central statistikinstitution (DST) Samarbejde med andre institutioner

Flere officielle statistikproducenter Ministerier

Styrelser og direktorater

Forskningsinstitutioner

Andre ”uofficielle” statistikproducenter Brancheorganisationer

Analyseinstitutter

Nyhedsproducenter

33

Statistik i Danmark

Page 34: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Nøgleord som statistik ofte gemmer sig bag

Statistik

Materialer

Data

Rapporter

Tal

Indikatorer

Publikationer

Nyheder

Undersøgelser

Udgivelser

Analyser

34

Nøgleord

Page 35: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Eksempler på andre offentlige

statistikudbydere:

Ministerier

Ministeriet for By, Bolig og

Landdistrikter – www.mbbl.dk

Finansministeriet – www.fm.dk

Styrelser og direktorater

Sundhedsstyrelsen – www.sst.dk

Skat – www.skat.dk

35

Page 36: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Andre statistikudbydere

Forskningsinstitutioner SFI – Det nationale forskningscenter for

velfærd – www.sfi.dk

Branche- oginteresseorganisationer Energi- og olieforum – www.eof.dk

Arbejderbevægelsens Erhvervsråd –www.ae.dk

Dansk Arbejdsgiverforening – www.da.dk

Nyhedsproducenter Børsen – www.borsen.dk

Andre Nationalbanken –

www.nationalbanken.dk

TNS Gallup – www.gallup.dk

36

Page 37: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Hvem har interesse i at vide noget om et givet emne?

Ministerier / styrelser

Forskningsinstitutioner

Brancheorganisationer

Interesseorganisationer

Nyhedsproducenter og analyseinstitutter

Hvad hedder det på den givne hjemmeside?

Statistik – analyse – data – tal – indikatorer – Publikationer – undersøgelser – rapporter –

materialer – udgivelser

Kan man have tillid til tallene?

Er det produceret af kompetente personer?

Er der en "varedeklaration"?

Kan der være tale om partiskhed (bias)?

Rigtigt mange af kilderne kan findes via Danmarks Statistiks Bibliotek -

http://www.dst.dk/da/informationsservice/dansk-efter-emne.aspx

37

Øvrige kilder til dansk statistik – opsamling

Page 38: Statistisk informationssøgning - kursus på Gentofte Centralbibliotek

Hvor kan man finde statistik om arbejdsmiljø?

38

Øvelse