Hakkereita uutishuoneeseen!
Datajournalismi on tutkivan journalismin Suuri Trendi
1.12.2011 © Esko Varho
• Esko Varho, Ylen A-studion toimittaja
• Kouluttanut toimittajia mm. tehokkaampaan nettihakuun, tietokantojen käyttöön
• Lokakuussa Kiovassa ”Global InvestigativeJournalism Conference”
• Yksi trendi ylitse muiden: datajournalismi
Termit
• Lähinnä Excellin käyttöä, analyysityökalujen käyttöä
CAR (Computer assisted reporting)
• Netin tietokantojen erilaista käyttöä
Tietokantajournalismi
• Uudempi termi, liittyy open data liikkeeseen, uusiin työkaluihin jne.
Datajournalismi
CAR (Computer assistedreporting)
TietokantajournalismiDatajournalismi
Tutkivan journalismin perinne maailmalla
• CAR on ollut iso osa alan koulutusta, varsinkin USA:ssa
• Mutta varsinkin Suomessa todellisuudessa ei kovin laajassa käytössä
• Toimittajat eivät ole tietotekniikan käytön pioneerejä, aivan päinvastoin!
Miten CAR:ia käytetty?
• Analyysityökaluja, lähinnä Excelliä ja verkostoanalyysityökaluja käytetään omien aineistojen analysointiin
CAR esimerkkejä:
• MOT raiskaustuomioista
• Tuomiot analysoitiin Excellillä
• Osoitti mm. isot alueelliset erot tuomioissa
CAR esimerkkejä:
• Brasililainen ”SecretDiaries” juttukokonaisuus
• Massiivinen julkisten varojen varastamisoperaatio
• Kuvio selvisi vasta kun toimittajat analysoivat aineistonsa Excellillä
Tietokantojen käyttö esimerkki
• CIA:n vankilalennot
• Eräs viime vuosien vaikuttavimmista tutkivan journalismin voimannäytöistä
• Stephen Grey käytti mm. netistä löytyvää lentodataa, pilottirekistereitä, lentobongareiden dataa
Datajournalismi laajenee räjähdysmäisesti:
Dataa tulvii koko ajan eri muodoissa
Open data –liike
Uusia tehokkaita työkaluja tulee koko ajan lisää
Keihäänkärkenä muut kuin toimittajat ja mediatalot
Uudet tavat esittää tuloksia ja tehdä rahaa
Dataa tulvii koko ajan lisää
• Esim. Wikileaks
• NY Timesillä yhtäkkiä 400 000 tekstidokumenttia
• Vaatii uudenlaisia työtapoja, uutta tekniikkaa, uutta osaamista
• Perusasia kuitenkin säilyy: journalistinen ammattitaito ymmärtää olennainen
• Olennaista löytää uusia tapoja yhdistellä eri datasettejä
Esim. Toronto Star
• Lehden kirjastoninformaatikko Joan SweeneyMarsh keksi vuonna 2006 ajaa ristiin vaalidataa ja maantieteellistä sosiaalista dataa, visualisoida karttoja yms.
• Tuloksena hätkähdyttäviä havaintoja ja palkittu juttusarja
Open data -liike
• Julkisesti tuotetun datan avaaminen uusiokäyttöön
• Aktivistit ajaneet, usein it-tausta, harvoin toimittajat asialla
• Nyt positiivinen ja pro-aktiivinensuhtautuminen myös esim. Eu:ssa ja Suomen hallituksella
• Toimittajat jälleen jälkijunassa, muuttaa koko tiedonvälityksen käsitettä
Esim. Sunnuntaisuomalainen
• Jarno Liskin juttu, tutkittiin mm. poliitikkojen osuuskauppakytköksiä
• Myös koottu data auki verkkosivulla
Uusia tehokkaita työkaluja
• Datan käsittelyyn, analyysiin, visualisointiin koko ajan lisää työkaluja
• Datan ”haaliminen” eli ”scraping”
• Periaatteessa tulee helpompia työkaluja, käytännössä kuitenkin toimittajien pitäisi kehittyä koodareiksi
Isoja datajournalismi projekteja:
• Farmsubsidies.org– Eu:n maataloustuki
tietokanta
• Investigative Dashboard– Mm. veroparatiisien
yritysrekistereitä yms.
• Olennaista: toimittajavetoisia, kansainvälisiä, muuttavat raakadataa käytettävään muotoon
Keihäänkärkenä muut kuin media
• Datajournalismia tuovat esiin mm. open data –aktivistit, koodarit ja data-analyysiin muuten perehtyneet
• Tiedostaneet itsekin ongelman: puuttuu usein kyky käsitellä dataa journalistisesti, tuottaa oikeasti relevanttia tietoa
• Ratkaisu: koodareiden ja toimittajien yhteistyö eli …
Hakkereita uutishuoneeseen!!
Kotimainen esimerkki
HS-Open
• HS openit, useita työpajoja
• opendata aktivisteja yhteistyössä Helsingin Sanomien kanssa
• Työryhmissä toimittaja, koodari, graafikko
• Hyviä tuloksia, ei vielä ammattimaista
Ulkomaisia esimerkkejä
The Guardian
• Datajournalismi on verkkosisällön ytimessä
• Kaikki keinot koko ajan käytössä:
• Visualisointi, timelinet, kartat
• Interaktiivisuutta
• Crowdsourcing eli yleisö mukaan journalistiseen prosessiin.
Uudet tavat esittää tuloksia ja tehdä rahaa
• Mediayhtiöiden perinteinen ansaintalogiikka heikkenee
• Tuotetaan verkkosisältöjä joita ei voi varastaa
• Interaktiivisuus, vaalikone
• Reuters ja the Economist eivät myy juttuja vaan dataa ja analyysia
Esimerkki Costa Ricasta
• Tämä on yksi mahdollinen visio datajournalismin suunnasta
• Ihan näin ei voi vielä toimia Suomessa
• Mutta toimintaperiaate täysin mahdollinen
Esimerkki Costa Ricasta
• La Nación, paikallinen lehti
• Giannina Segnini, kansainvälisesti tunnettu tutkiva toimittaja
• Toimituksen palkattiin kolme ”hakkeria”, koodaus ja datamining taituria, toimitukselliseen työhön
Vaihe 1:
• Perinteinen Car
• Verrattiin pormestariehdokkaita
• Mm. oikeusistuinten dataa koottiin toimitukseen
• Verrattiin myös mm. listaan veroja maksamattomista jne. graf. © Giannina Segnini
Vaihe 1:
Vaihe 1
• Löytyi raskauttavaa aineistoa ehdokkaista
• Saatiin juttuja
Vaihe 2
Vaihe 2
• Toimituksella jo rikosdata oikeusistuimista
• Verrataan uuteen dataan, opettajatietokantaan
• Löytyykö pedofiilituomittuja opettajia?
Vaihe 3
• Kaikki eri datasetit tehokkaassa käytössä
• Jatkuvaa ristiintaulu-kointia
• Koko ajan uutta tietoa nopeasti
graf. © Giannina Segnini
Ongelmia?
• Lainsäädäntö, yksityisyyden suoja
• Datan maksullisuus, mutta tämä on muuttumassa
• Journalismin käsite hämärtyy entisestään?
Datajournalismi
• Tulee muuttamaan toimittajien, informaatikkojen, datan tuottajien työtä
• Painopiste siirtyy puuhastelusta ammattimaiseen mediaan
• Perusjournalismin ydin ei katoa
• ”Vain olennainen on tärkeää”