8
Massadata ja viralliset tilastot Tutkas-seminaari 17.9.2014 Timo Koskimäki Tilastotuotannon ylijohtaja Tilastokeskus

Massadata ja viralliset tilastot, Timo Koskimaki

Embed Size (px)

DESCRIPTION

Massadata ja viralliset tilastot Tutkas-seminaari 17.9.2014 Timo Koskimäki

Citation preview

Page 1: Massadata ja viralliset tilastot, Timo Koskimaki

Massadata ja viralliset tilastot

Tutkas-seminaari

17.9.2014 Timo Koskimäki

Tilastotuotannon ylijohtaja

Tilastokeskus

Page 2: Massadata ja viralliset tilastot, Timo Koskimaki

Sisällys

Käsitteistöä

Tilasto, vanha ja uusi big data

Uuden massadatan tyypittelyä

Tekninen, sisällöllinen, avoin, suljettu

Massadata ja viralliset tilastot

Juridiset ja muut haasteet

Mahdolliset hyödyt

Page 3: Massadata ja viralliset tilastot, Timo Koskimaki

Käsitteistöä

Tilasto:

Toistuva kvantitatiivinen tutkimus

jolla on yhteiskuntapoliittista merkitystä

joka on laadittu noudattaen tieteellisiä

periaatteita ja tilastoalan käytännesääntöjä

joka tuottaa numeerista tietoa myös muiden

edelleen jalostettavaksi

Page 4: Massadata ja viralliset tilastot, Timo Koskimaki

Vanha ja uusi big data

Vanha big data

Hallinnolliset rekisteriaineistot (verotus, väestö,

sosiaaliturva, ulkomaankauppa…)

Olleet digitaalisia vuosikymmenet

Muodostavat nykyisen tilastotuotannon perustan

ja myös pääosan sisällöstä, usein täydennettynä

tilastollisilla tiedonkeruilla

Uusi big data

Yritysten ja kansalaisten elämän digitalisoitumisen

tuloksena syntyvä datamassa

Page 5: Massadata ja viralliset tilastot, Timo Koskimaki

Uuden big datan tyypittelyä

Julkishallinnon avoin data (esim.

karttakoordinaatit, liikennetiedot,

säähavaintotiedot j.n.e)

WWW –avoin sisältö

(verkkokaupat, blogit, sivustot)

WWW rajoitetusti avoin (Google

Yksityisten toimijoiden haltuun

generoituvat tekniset massadatat

(esim. paikannustiedot,

matkapuhelinliikenteen tiedot)

Trends, Analytics, Twitter,

Facebook…)

Yksityisten toimijoiden haltuun

generoituvat sisällöt (ostokset,

luottokortit ja muut yritysten

asiakkaita koskevat tiedot)

Avoin

Suljettu

Tekninen Sisällöllinen

Page 6: Massadata ja viralliset tilastot, Timo Koskimaki

Massadata ja viralliset tilastot

Vanhan massadatan ongelmat

tekninen käsittely, pääsy aineistoihin, kattavuus,

edustavuus, tietojen koherenssi, laatu ja

hallinnollisen tiedon yhteiskuntatieteellinen tulkinta

pitkälti ratkaistu

Uuden massadatan ongelmat

tekninen käsittely, pääsy aineistoihin, kattavuus,

edustavuus, tietojen koherenssi, laatu ja

massadatan yhteiskuntatieteellinen tulkinta

pitkälti ratkaisematta

Page 7: Massadata ja viralliset tilastot, Timo Koskimaki

Skenaariot lähivuosille

Tilastotuotannon infrastruktuuri

Lainsäädäntö – oikeus saada uuden massadatan toimijoilta

tilastointikäyttöön

Nykyinen tilastolainsäädäntö ei tunnista uutta dataa

Jos tulee käyttöön tilastoissa, tulee myös tutkimuskäyttöön

Tekniset fasiliteetit ja tietotaito uuden massadatan käsittelyyn

Investointikynnys ei vielä ylittynyt (juuri missään maassa),

kokeiluja käynnissä

Ongelmana rakenteiden ja sisältöjen nopea muutos

Page 8: Massadata ja viralliset tilastot, Timo Koskimaki

Massadatan mahdolliset hyödyt

Nopeutuminen, sisältöjen monipuolistuminen?

Tiedonantajien rasituksen väheneminen?

Kustannussäästöt?

Jos massadatalla pystytään toteuttamaan

edullisemmin nykyisiä suoria tiedonkeruita

Ei mikään helppo asia, massadatan jalostaminen

järkeviksi tilastoiksi vaatii huomattavan

työpanoksen

Kuten vaatii vanhankin massadatan jalostus