12
Tutkijan puheenvuoro Matti Sarvimäki Aalto ja VATT Tutkimusaineistojen etäkäyttö ja tietosuoja, 20.1.2015

Tutkijan puheenvuoro, Matti Sarvimäki

Embed Size (px)

Citation preview

Page 1: Tutkijan puheenvuoro, Matti Sarvimäki

Tutkijan puheenvuoro

Matti Sarvimäki

Aalto ja VATT

Tutkimusaineistojen etäkäyttö ja tietosuoja, 20.1.2015

Page 2: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotuksia TK:lle

• Laskentateho kuntoon!

– nykykäytännössä usein lähes mahdotonta työskennellä

– osaa menetelmistä ei kannatta edes yrittää käyttää

– laskentaintensiiviset ajot haittaavat myös muiden käyttäjien työtä

• Miten?

– erillinen palvelu paljon tehoa tarvitseville?

– tehokkaampi käyttäjien allokointi palvelimille?

Page 3: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotuksia tutkijoille

• Etäkäytössä on kaksi niukkaa resurssia: – järjestelmän laskentateho / säilytyskapasiteetti

– tutkijapalveluiden työntekijöiden aika

• Meillä on oikeus käyttää näitä resursseja … mutta kaikki kärsivät tehottomuudesta

• Miksi vähentää resurssien hukkakäyttöä? – muiden työskentely tehostuu

– sinun työskentelysi tehostuu (enemmän!)

• Lukusuositus:– Gentzkow & Shapiro: Code and data for the social sciences: A

practitioner's guide. [link]

Page 4: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotuksia

1. Ajattele ensin

2. Noudata tehokasta projektinhallintastrategiaa

3. Tee itsellesi harjoitteludata

4. Koodaa tehokkaasti

5. Seuraa resurssien käyttöä(si)

6. Tee suuret ajot viikonloppuna / yöllä

7. Anna palautetta

8. Pyydä vain tarpeelliset tulokset ulos

Page 5: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 1. Ajattele ensin

• Tee näin:

– määrittele täsmällinen tutkimuskysymys

– mieti millainen analyysi siihen vastaa

– tee analyysi (ja tarpeelliset robustness checkit)

• Miksi?

– hyvä empiirinen työ perustuu ennalta mietittyihin analyyseihin (ei spesifikaatiokalasteluun!)

– turhien analyysien ajo vie sinulta (ja muilta) aikaa

Page 6: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 2. Noudata tehokasta projektinhallintastrategiaa

• Tee näin:

– lue Gentzkow & Shapiro

– noudata heidän ohjeitaan

• Miksi?

– säästät paljon aikaa

– teet vähemmän virheitä

– kuormitat vähemmän etäyhteyttä

Page 7: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 3. Tee itsellesi harjoitteludata

• Tee näin:

– ota analyysisi perusdatasta pieni otos

– kirjoita koodi käyttäen tätä dataa

– aja tulokset koko datalla kun koodi on valmis

• Miksi?

– säästää sinun (ja muiden!) aikaa

– teet parempaa tutkimusta (muistuttaa spesifikaatioon ennalta sitoutumista)

Page 8: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 4. Koodaa tehokkaasti

• Tee näin:

– lue Gentzkow & Shapiro

– noudata heidän ohjeitaan

• Miksi?

– säästät paljon aikaa

– teet vähemmän virheitä

– kuormitat vähemmän etäyhteyttä

Page 9: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 5. Seuraa resurssien käyttöä(si)

• Tee näin:

– käynnistä Task Manager painamalla ctrl-shift-esc

– katso paljonko resursseja käytät

– katso paljonko muut käyttävät

– oleta että muut tekevät samoin

• Miksi?

– seuraavat kalvot

Page 10: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 6. Tee suuret ajot viikonloppuna / yöllä

• Tee näin:

– pistä iso ajo pyörimään

– sulje etäyhteysikkuna, mutta älä kirjaudu ulos(ajo jää pyörimään)

• Miksi?

– kaikki osaavat nyt seurata resurssiesi käyttöä

– … ja jotkut saatavat noudattaa seuraavaakin ohjetta

Page 11: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 7. Anna palautetta

• Tee näin:

– jos jokin ei toimi, kerro siitä henkilölle joka pystyy sen korjaamaan

– jos osaat, ehdota miten asian voisi korjata

• Muista kuitenkin:

– joskus on pakko ajaa isoja ajoja (päivälläkin)

– tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole heidän vikansa)

– jotkut ongelmat on vaikea ratkaista

Page 12: Tutkijan puheenvuoro, Matti Sarvimäki

Ehdotus 8. Pyydä vain tarpeelliset tulokset ulos

• Tee näin:– mieti mitä oikeasti aiot raportoida

– varmista että et pyydä mitään, mitä ulos ei voi antaa

– laita output kansioon readme-tiedosto, jossa kerrot täsmällisesti mitä pyytämäsi materiaali on, miksi sen antaminen ei ole laitonta ja millä koodilla se on tehty

• Miksi?– tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole

heidän – tai muiden tutkijoiden – vika)

• Ehdotus TK:lle:– ilmainen ”välitila” etäyhteydettömille kanssakirjoittajille,

jossa tarkastamattomia tuloksia voisi hallitusti katsella