View
4
Download
0
Category
Preview:
Citation preview
Datatiede verkko-opetuksessa
Waltteri Turunen
Pro gradu -tutkielma
Tietojenkäsittelytieteen laitos
Tietojenkäsittelytiede
Heinäkuu 2016
i
ITÄ-SUOMEN YLIOPISTO, Luonnontieteiden ja metsätieteiden tiedekunta, Kuopio
Tietojenkäsittelytieteen laitos
Tietojenkäsittelytiede
Turunen, Jon Lauri Waltteri: Datatiede verkko-opetuksessa
Pro gradu -tutkielma, 78 s.
Pro gradu -tutkielman ohjaaja: FT Maija Marttila-Kontio
Heinäkuu 2016
Tiivistelmä: Internetin ja tieto- ja viestintätekniikan myötä lisääntyneet verkko-oppi-
misympäristöt asettava uusia mahdollisuuksia ja haasteita opetukselle. Samalla lisään-
tyneet datamäärät ja niiden analysointimahdollisuudet ovat johtaneet datatieteen syn-
tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä
tutkielma on kirjallisuuskatsaus, jossa kerrotaan näiden kahden alan kosketuspinnasta.
Tutkielma käsittelee ensimmäisessä kappaleessa verkko-opetusta alkaen sen histori-
asta 1960-luvulta tähän päivään saakka, jonka jälkeen esitellään verkko-opetuksen teo-
riaa. Lopuksi käydään läpi verkko-opetuksen hyötyjä ja haittoja. Toisessa kappaleessa
keskitytään datatieteeseen. Datatieteestä pyritään muodostamaan kokonaiskuva esitte-
lemällä sen eri määrittelyt ja sijainti suhteessa muihin tutkimusaloihin. Kerrotaan
myös datatieteen historiasta ja nykytilasta, etenkin sen yleistymisen syistä. Tämän jäl-
keen esitellään joitain sen käyttökohteista ja käydään läpi datatieteen prosessi ja kehi-
tyssuunnat. Viimeisessä kappaleessa kerrotaan, kuinka datatiedettä hyödynnetään
verkko-opetuksessa. Ensin tutkitaan miksi datatiedettä pitäisi soveltaa verkko-opetuk-
seen, sitten esitellään, miten sitä sovelletaan ja mihin sitä verkko-opetuksessa voidaan
soveltaa. Lopuksi käsitellään muutama merkittävä tapaustutkimus, katsaus markki-
noilla oleviin tuotteisiin ja tulevaisuuden odotuksiin.
Avainsanat: datatiede verkko-opetuksessa, datatiede, verkko-opetus, oppimisen ana-
lytiikka, koulutustiedonlouhinta
ACM-luokat (ACM Computing Classification System, 1998 version): J.1, K.3.1
ii
UNIVERSITY OF EASTERN FINLAND, Faculty of Science and Forestry, Kuopio School of Computing
Computer Science
Turunen, Jon Lauri Waltteri: Data science in e-learning
Master’s Thesis, 78 p.
Supervisor of the Master’s Thesis: PhD Maija Marttila-Kontio
July 2016
Abstract: The internet along with information and communication technologies have
given rise to e-learning environments which present new opportunities and challenges
for education. At the same time increased amounts of data and the capabilities to ana-
lyze it have led to the emergence of data science. E-learning generates data that can be
processed with the methods of data science. This study is a literature review, the pur-
pose of which is to explore the contact surface between the two sectors. The thesis
starts with tracing the origins of e-learning from its history in 1960s to the present day
and, after that, we go through the theory behind e-learning and end up with the de-
scription its advantages and disadvantages. The second section will focus on data sci-
ence and it starts by defining data science and its relation to other scientific disciplines.
It continues on to describe the history and current state of data science, particularly the
reasons of recent emergence, and the section ends with the presentation of some of its
uses and going through the process of data science and its future trends. The final
section explains how data science can be used with e-learning. First we go through the
motivation of applying data science to e-learning, then discuss how and where specif-
ically to apply it. Finally, we go through a few important case studies, followed by an
overview of the products on the market and we end with some future expectations.
Keywords: data science in e-learning, data science, e-learning, learning analytics, ed-
ucational data mining
CR Categories (ACM Computing Classification System, 1998 version): J.1, K.3.1
iii
Esipuhe
Tämä tutkielma on tehty Itä-Suomen yliopiston Tietojenkäsittelytieteen laitokselle ke-
väällä 2016. Tahdon kiittää ohjaajaani Maija Marttila-Kontiota hyvästä ohjauksesta ja
kirjoittajan takakireän deadlinen sietämisestä.
Suurin kiitos tästä työstä kuuluu kuitenkin vaimolleni Tuijalle, joka pyöritti kotita-
loutta vailla valituksen sanaa aviomiehen istuessa iltaan asti napit korvilla tietoko-
neella näppäimistöä nakuttamassa oltuaan ensin pitkän päivän lorvailemassa toimis-
tolla syöden työpaikkalounaita, kun perheelle oli tarjolla vain haaleaa makaronivelliä.
Pahoitteluni myös kahdelle tyttärelleni, joilla ei viikkokausiin ollut isää ennen iltaseit-
semää. Viimeiseksi haluaisin kiittää Spotify-suoratoistopalvelua, joka tuotti mainion
Electronic Study Music -soittolistan, jonka avulla olen saanut työrauhan niin yliopis-
tolla ja anoppilassa kuin kotonakin ja auton kyydissä.
Vuorela, Heinäkuu 2016
Waltteri Turunen
iv
Lyhenneluettelo
AR Augmented Reality; lisätty todellisuus.
CD-ROM Compact Disc - Read-Only Memory. Tietokoneissa käytettävä tiedon
talletuslevy, jota voi ainoastaan lukea.
EDM Educational Data Mining; koulutustiedonlouhinta
ITS Intelligent Tutoring System; älykäs opetusjärjestelmä
Jisc Brittiläinen ei-kaupallinen yhdistys. Entinen Joint Information Systems
Committee.
KPI Key Performance Indicator; keskeinen suorituskykymittari
LA Learning Analytics; oppimisen analytiikka
LAK Learning Analytics and Knowledge. Ks. LA
LMS Learning Management System; oppimisen hallintajärjestelmä
MOOC Massive Open Online Course; kaikille avoin verkkokurssi
ROI Return On Investment; sijoitetun pääoman tuotto
SIS Student Information System; opiskelijatietojärjestelmä
SNA Social Network Analysis; sosiaalisten verkkojen analysointi
VR Virtual Reality; virtuaalitodellisuus.
v
Sisällysluettelo
1 Johdanto ...................................................................................................... 1
2 Verkko-opetus ............................................................................................. 3
2.1 Verkko-opetuksen historiaa ja nykytilanne ........................................ 3 2.2 Verkko-opetuksen teoriaa ................................................................... 7
2.2.1 Oppimiskäsitykset ............................................................... 7 2.2.2 Pedagogisia malleja .......................................................... 10
2.2.3 Verkko-oppimisympäristöjen eri tasot .............................. 13
2.2.4 Oppimisaihiot .................................................................... 13 2.3 Verkko-opetuksen hyötyjä ja haittoja ............................................... 14
2.3.1 Hyötyjä .............................................................................. 14 2.3.2 Haittoja .............................................................................. 15
3 Datatiede ................................................................................................... 17
3.1 Määritelmät ....................................................................................... 17
3.1.1 Tiedon eri tasot ................................................................. 17 3.1.2 Big data ............................................................................. 19
3.1.3 Datatiede ........................................................................... 20 3.2 Datatieteen historia ja nykytila ......................................................... 23
3.2.1 Datatieteen juuret .............................................................. 23
3.2.2 Syyt yleistymiselle ............................................................ 24
3.3 Datatieteen käyttökohteet ................................................................. 25 3.4 Datatiede prosessina ......................................................................... 28
3.4.1 Kysymyksen asettelu ........................................................ 29
3.4.2 Tiedon hankinta ................................................................ 30 3.4.3 Tiedon puhdistaminen ....................................................... 30
3.4.4 Kuvaileva analytiikka ....................................................... 31 3.4.5 Ennustava analytiikka ....................................................... 32 3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen33
3.5 Datatieteen kehityssuuntia ................................................................ 35
4 Datatiede verkko-opetuksessa ................................................................... 37
4.1 EDM ja LAK .................................................................................... 37 4.2 Sovellusalat ....................................................................................... 39
4.2.1 Opiskelijan tietämyksen mallintaminen ............................ 39
4.2.2 Käyttäytymisen mallintaminen ......................................... 40 4.2.3 Kokemuksen mallintaminen ............................................. 41
4.2.4 Opiskelijan profilointi ....................................................... 41 4.2.5 Aihealueen mallintaminen ................................................ 41 4.2.6 Oppimisaihioiden ja pedagogisen mallin analysointi ....... 42
4.2.7 Trendianalyysi .................................................................. 42 4.2.8 Mukautuminen ja yksilöllistäminen.................................. 42
4.3 Hyödyt .............................................................................................. 43 4.3.1 Opiskelun laatu ................................................................. 43
4.3.2 Opetuksen laatu ................................................................. 43
vi
4.3.3 Opiskelijapysyvyyden parantaminen ................................ 44
4.3.4 Kustannustehokkuus ......................................................... 45 4.4 Käytäntö ............................................................................................ 45
4.4.1 Menetelmät ....................................................................... 45 4.4.2 Infrastruktuuri ................................................................... 49 4.4.3 Työkalut ............................................................................ 50
4.4.4 Rajoitteet ........................................................................... 51 4.5 Esimerkkejä datatieteen hyödyntämisestä verkko-opetuksessa ........ 52
4.5.1 Purduen yliopisto .............................................................. 52 4.5.2 Nottingham Trentin yliopisto ............................................ 54 4.5.3 PeT-työkalu ....................................................................... 56
4.6 Datatiedettä hyödyntäviä verkko-opetuksen tuotteita ....................... 57 4.7 Datatieteen ja verkko-opetuksen yhteinen tulevaisuus ..................... 58
5 Pohdinta .................................................................................................... 60
Viitteet .............................................................................................................. 63
1
1 Johdanto
Nykyään lähes jokainen koulutuslaitos hyödyntää opetuksessaan tietoverkkoja, eten-
kin internetiä. Verkko-opetus on suosittua, koska se mahdollistaa helpon tiedonjaka-
misen sekä aika- ja paikkariippumattoman opiskelun. Joustavalla opiskelulla helpote-
taan opiskelua, koska opiskelijoiden ja opettajien ei tarvitse olla enää samassa paikassa
vaan kukin voi osallistua opiskeluun, miten ja mistä haluavat. Vaikka jokainen voikin
osallistua opetukseen eri paikasta, verkko-opetus kuitenkin parantaa yhteisöllistä op-
pimista sosiaalisten työkalujen kautta. (Tervo, 2012) Verkko-opiskelu tapahtuu
verkko-oppimisympäristöissä, joissa tapahtuvista toiminnoista voidaan tallentaa dataa
myöhempää jatkokäsittelyä varten.
Datan määrä maailmassa kasvaa räjähdysmäisesti. 90% maailman datasta on syntynyt
viimeisen kahden vuoden aikana ja datan määrän on ennustettu kaksinkertaistuvan vii-
den vuoden sisällä. (B. Walker, 2015) Datan määrän kasvu ja sen analysointimahdol-
lisuuksien parantuminen ovat nostaneet datatieteen muodikkaaksi ilmiöksi. Datatiede
on uusi tieteenala, joka sijaitsee tilastotieteen, ohjelmoinnin ja alakohtaisen osaamisen
kohtaamispisteessä. Sen avulla voidaan saavuttaa merkittäviä hyötyjä lähes alasta riip-
pumatta. Sen avulla voi muun muassa tehostaa liiketoimintaa, parantaa julkista liiken-
nettä, vähentää potilaskuolleisuutta sekä ennustaa epidemioiden puhkeamista.
Datatiedettä sovelletaan verkko-opetuksessa opiskelijan tietämyksen, käyttäytymisen
ja opiskelukokemuksen mallintamiseen, opiskelijan profilointiin ja opetuksen aihealu-
een mallintamiseen. Lisäksi sitä voidaan käyttää oppimisaihioiden ja pedagogisten
mallien analysointiin, trendianalyysiin sekä mallianalyysiin. (Bienkowski, Feng, &
Means, 2012) Datatieteen avulla on mahdollista nostaa opiskelun ja opetuksen laatua,
parantaa opiskelijapysyvyyttä sekä opetuksen kustannustehokkuutta. (Sclater,
Peasgood, & Mullan, 2016)
Tutkielman luvussa 2 esitellään verkko-opetuksen historiaa ja nykytilannetta, sen teo-
reettista taustaa sekä sen hyötyjä että haittoja. Luvussa 3 pyritään määrittelemään da-
2
tatiede terminä, datatieteen historiaa ja miksi se on yleistynyt juuri nyt. Luvussa käy-
dään myös läpi datatieteen eri käyttökohteita ja tutustutaan tarkemmin sen prosessiin,
kunnes lopulta esitetään datatieteen mahdollisia kehityssuuntia. Datatieteen sovellusta
itse verkko-opetukseen tutkitaan luvussa 4. Siinä esitellään ensin kaksi merkittävintä
tutkimusalaa aiheesta, jonka jälkeen esitellään saavutettavat hyödyt. Seuraavaksi ker-
rotaan käytännön soveltamisesta sekä sovellusaloista eli mihin kaikkeen datatiedettä
voi verkko-opetuksessa käyttää. Lopuksi esitellään muutama tapaustutkimus ja kau-
pallinen tuote sekä luodaan katsaus tulevaan. Tutkielma päättyy aiheen pohdintaan ja
ajatuksiin sen tulevaisuudesta.
3
2 Verkko-opetus
Tässä luvussa määritellään verkko-opetuksessa käytettävät termit. Luku 2.1 kertoo
verkko-opetuksen historiasta ja nykytilanteesta ja luku 2.2 käsittelee verkko-opetuksen
teoriaa. Luvussa 2.3 punnitaan verkko-opetuksen hyötyjä ja haittoja.
Verkko-opetuksella tarkoitetaan suunnitelmallista tietoverkkojen, erityisesti internetin
hyödyntämistä opetuksessa ja opiskelussa (Nevgi et al., 2005; Tella et al., 2001). Opis-
kelija on verkon kautta vuorovaikutuksessa toisten opiskelijoiden, opettajan, oppima-
teriaalien tai muiden aineistojen ja palveluiden kanssa. Pedagogiikka tarkoittaa tapaa,
jolla opetus järjestetään, sekä sen kasvatuksellisia periaatteita (Hellström, 2008), joten
verkkopedagogiikan voidaan käsittää tarkoittavan tapaa, jolla verkko-opetus järjeste-
tään sekä sen järjestämisen teoreettista sisältöä.
Tässä yhteydessä tietoverkolla tarkoitetaan tietokoneiden ja tietoliikennelaitteiden
muodostamaa fyysistä kokonaisuutta, jonka avulla on mahdollista siirtää informaa-
tiota. Verkkokäsitteeseen liittyy myös käsitys virtuaalisista toiminnoista, jolloin asioi-
den tekeminen ei edellytä fyysistä läsnäoloa tai ympäristöä (Lepistö, 2008).
Oppimisympäristöksi kutsutaan paikkaa tai yhteisöä, jossa ihmisillä on käytössään eri-
laisia resursseja, joiden avulla he voivat oppia ymmärtämään erilaisia asioita ja kehit-
tämään mielekkäitä ratkaisuja erilaisiin ongelmiin (Manninen, 2001). Esimerkiksi
luokkahuone on perinteinen fyysinen oppimisympäristö. Verkko-opetus tapahtuu
verkko-oppimisympäristössä, joka usein sisältyy oppimisen hallintajärjestelmään
(eng. Learning Management System, LMS), jonka avulla voi hallinnoida ja seurata
opetusta sekä tuottaa siitä raportteja. (Ryann K. Ellis, 2010)
2.1 Verkko-opetuksen historiaa ja nykytilanne
Verkko-opetus sai alkunsa 1960-luvulla, kun PLATO (Programmed Logic for Auto-
matic Teaching Operations) kehitettiin Illinoisin yliopistossa Yhdysvalloissa (Bitzer,
4
Lyman, & Easley, 1966). Se oli yksi ensimmäisistä tietokoneita hyödyntävistä oppi-
misympäristöistä ja se oli käytössä lähinnä akateemisissa laitoksissa. PLATO mahdol-
listi tuhansien opiskelijoiden samanaikaisen ja yksilöllisen opetuksen paikallisesti. Se
käytti aluksi näyttönä televisiota ja erityistä näppäimistöä komentojen antamiseksi.
PLATO:ssa esiintyi monia nykyisten oppimisympäristöjen ominaisuuksia, kuten säh-
köinen oppikirja, tiedonhakumahdollisuus, tukijärjestelmä avun saamiseksi sekä hen-
kilökohtaiset muistiinpanot. Siihen sisältyi myös suoritusten ja toimintojen tallentumi-
nen myöhempää tilastollista analyysiä varten.
1980-luvun alussa julkaistiin ensimmäiset oppimisympäristöt, joihin sai etäyhteyden
modeemin avulla. Niitä hyödynnettiin mm. Ison-Britannian The Open University -yli-
opistossa. Nämä ensimmäiset varsinaiset verkko-oppimisympäristöt pohjautuivat vi-
deotex-tekniikkaan, joka mahdollisti yhteyden ottamisen keskustietokoneeseen puhe-
linlinjoja pitkin käyttäen televisiota näyttönä – aivan kuten kaksisuuntainen teksti-tv.
Myöhemmin näihin ympäristöihin voitiin ottaa yhteyttä Internetin kautta omalta koti-
koneelta.
Yrityksissä sähköiset oppimisympäristöt alkoivat yleistyä 1980-luvun puolessavälissä
CD-ROM (Compact Disc - Read-Only Memory) -teknologian myötä. CD-levyt olivat
paljon halvempia kuin kouluttajat ja kursseja oli helppo levittää, mutta CD-levyihin
perustuvilla kursseilla oli kuitenkin huikea keskeyttämisaste eikä tietokoneen edessä
istuminen ollut työntekijälle kiinnostavaa – kouluttaja ei ollut läsnä auttamassa tai mo-
tivoimassa opiskelijaa. (Cross & Jay, 2004)
1990-luvun lopussa opetuksen sisältöä alettiin jakaa Internetin välityksellä ja opetus
voitiin järjestää opetuspaikasta tai -ajasta riippumatta. Välitystapa mahdollisti myös
räätälöidyt koulutusportaalit, suoritusten seurannan, uutiskirjeet ja keskusteluryhmät
(Cross, 2004). Internetin toiminnallisuuden parantuminen mahdollisti myös multime-
dian ja verkkokameran käytön opetuksessa. Teknologian kehittyessä kustannukset ale-
nivat ja se mahdollisti opetuksen entistä laajemmalle yleisölle. Käyttäjät saattoivat
suorittaa tutkintoja eri yliopistoista ja sivistää itseään kursseilla joustavasti ja riippu-
mattomasti kotoaan käsin heille sopivaan kellonaikaan.
5
Yritysmaailmassa työntekijöiden kouluttamiseksi alettiin myös käyttää verkko-ope-
tusmallia. Niin uudet kuin kokeneetkin työntekijät saattoivat nyt helposti kerrata jo
opittuja asioita ja oppia uutta näin lisäten yrityksen henkistä pääomaa. Tämä olikin
tärkeää etenkin IT-sektorin kasvaessa, sillä sen työkalut vanhenivat suhteellisen nope-
asti, jolloin kouluttamisesta tuli entistä tärkeämpää.
Suomessa Internetiä alettiin hyödyntää koulutukseen 1990-luvun puolivälissä
(Taipalmaa, 2008). Alta Vista Forum oli yksi ensimmäisistä Internetiä hyödyntävistä
oppimisympäristöistä. Se oli eräänlainen yhdistelmä uutisryhmää ja sähköpostilistaa,
jonka avulla voitiin luoda keskusteluketjuja ja -arkistoja. Se mahdollisti samanaikai-
sen, ajasta riippumattoman viestinnän monelle opiskelijalle ja sitä käytettiin yleisen
viestinnän lisäksi henkilökohtaiseen opastukseen.
2010-luvulla verkko-opetukseen tuotiin myös sosiaalinen elementti. Yhteisöt tarjoavat
opiskelijalle tukea ja paikan, jossa vaihtaa ajatuksia opetuksesta. Yhteisöt voivat sijaita
joko itse verkko-oppimisympäristössä tai kaikille avoimessa sosiaalisessa verkossa.
Opetuksessa voitiin myös hyödyntää mm. blogeja ja wikejä keskustelun ja vuorovai-
kutteisuuden lisäämiseksi.
2010-luvulla myös MOOC- (eng. Massive Open Online Course) -kurssien tarjonta li-
sääntyi vahvasti. Ne tarjoavat Internetin välityksellä kaikille avoimia yliopistotason
kursseja. Näin opiskelija itse voi määritellä mitä haluaa opiskella ja kuinka paljon
käyttää siihen aikaa. Yleensä MOOC-kurssit eivät aluksi olleet hyväksiluettavissa pe-
rinteisten oppilaitosten opintokokonaisuuksiin, mutta sittemmin monet opetuksen jär-
jestäjät ovat tuoneet tarjolle maksullisia suoritustodistuksia ja jopa kokonaisia tutkin-
toja.
Eräitä tämän hetken tunnetuimpia MOOC-tarjoajia ovat Coursera, Udacity ja edX.
Coursera on niistä suurin tarjoten 1764 yliopistotason kurssia 147 yhteistyötä tekevien
yliopistojen ja instituuttien tarjonnasta. Opiskelijoita sillä on ollut yli 17 miljoonaa.
Suurin osa Courseran kursseista on ilmaisia, mutta se tarjoaa myös maksullisia kurs-
sikokonaisuuksia sertifikaatteineen, joista voi saada myös opintopisteitä akateemisiin
oppilaitoksiin. Udacity keskittyy enemmän ammattitaidon lisäämiseen ilmaisilla ja
6
maksullisilla kursseilla. Sen erityinen innovaatio on kurssimaksun vaativat ”nanotut-
kinnot”, joille he lupaavat työllistämistakuun – jos opiskelija ei saa työpaikkaa tietyn
ajan kuluessa, hän saa kurssimaksut takaisin. Sen kurssitarjonta käsittää 134 kurssia
19 eri yhteistyökumppanilta, esimerkiksi Googlelta, Amazonilta ja Facebookilta. edX
on voittoa tavoittelematon järjestö, joka tarjoaa yli 800 avointa yliopistotason kurssia
yli 88 kumppanilta. Opiskelijoita on ollut yli 6 miljoonaa ja kurssi-ilmoittautumisia yli
19 miljoonaa.
Tällä hetkellä Suomessa MOOC -kursseja järjestävät Aalto-yliopisto ja Helsingin yli-
opiston tietojenkäsittelytieteen laitos. Kursseja on yhteensä 12 kappaletta tietojenkä-
sittelyn ja matematiikan alalta. Ne ovat ilmaisia kaikille ja ne voidaan myös hyväksi-
lukea laitosten opinnoissa. Osa Helsingin yliopiston MOOC-kursseista toimii myös
osittaisena pääsykokeena laitokselle. (Helsingin yliopisto, 2016)
Suomen Virtuaaliammattikorkeakoulu tarjoaa AMK-tason verkko-opetusta. Se on ol-
lut toiminnassa vuodesta 2000 lähtien ja se tarjoaa vuosittain n. 800 ammattikorkea-
koulujen järjestämää opintojaksoa, jotka tarjotaan enimmäkseen verkko-opintoina.
Opinnot ovat avoinna vain AMK-tutkintoa suorittaville tai vaihto-opiskelijoille.
Suosituimmat verkko-oppimisympäristöt tällä hetkellä ovat Blackboard, De-
sire2Learn, Moodle, Sakai ja Pearson. Nykyiset verkko-oppimisympäristöt tarjoavat
työkaluja, joilla opiskelijoiden hallinta, seuranta ja rekisteröinti on erotettu yksittäi-
sistä kursseista. Opiskelijakohtainen suoritusten yleinen ja yksityiskohtainen rapor-
tointi mahdollistaa arvioinnin opiskelun vaikutuksesta tulevaan suoritustasoon. Tätä
suoritustietoa voi hyödyntää esimerkiksi ROI-laskennassa (Return Of Investment) yri-
tysmaailmassa. Erilaisen suoritusdatan keräämistä ja sen raportointia pidetään kilpai-
luvalttina verkko-oppimisympäristöjen välisessä kilpailussa. (Stone & Zheng, 2016)
Tällä hetkellä 93% korkeakouluista käyttävät verkko-oppimisympäristöjä ja 65% pi-
tävät verkko-opetusta kriittisenä pitkän aikavälin suunnitelmilleen. Työmarkkinoiden
kasvavat koulutusvaatimukset vaativat tulevaisuuden verkko-oppimisympäristöiltä
avoimuutta, oppijakeskeisyyttä ja joustavuutta. Tämän lisäksi niiden pitää perustua
7
yhteistyöhön, mahdollistaa suoritustason mittaukset ja raportointi sekä olla saatavilla
päätelaitteesta riippumatta. (Stone & Zheng, 2016)
2.2 Verkko-opetuksen teoriaa
Tässä luvussa käsitellään verkko-opetuksen teoreettista puolta. Ensin esitellään oppi-
miskäsitykset ja kuinka ne liittyvät verkko-opetukseen. Sen jälkeen esitellään muu-
tama verkko-opetukseen liittyvä pedagoginen malli, jonka jälkeen esitellään verkko-
oppimisympäristöjen eri tasot. Lopuksi esitellään oppimisaihio-käsite.
2.2.1 Oppimiskäsitykset
Opetus perustuu opettajan käsitykseen oppimisesta ja opetuksesta. Opettajan pedago-
ginen ajattelu ja opetuksen suunnittelu ja toteutus perustuvat erilaisiin oppimiskäsityk-
siin eli teoreettisiin malleihin siitä, miten ihminen oppii. Tässä luvussa esitellään be-
havioristinen, kognitiivinen, konstruktivistinen sekä realistinen oppimiskäsitys.
Behavioristinen oppimiskäsitys
Kuten perinteinen luokkahuoneopetus, myös varhainen verkko-opetus perustui beha-
vioristiseen oppimiskäsitykseen, joka painottaa passiivista lähestymistapaa oppimi-
seen (Greitzer, 2002). Se pohjautuu behaviorismiin, josta esimerkkinä käy kuuluisa
psykologi Pavlov ja hänen koiransa, jotka oppivat kuolaamaan kuullessaan kellon soi-
van. Behavioristinen oppimiskäsitys korostaa opettajan, sisällön ja materiaalin roolia
oppimisessa ja opiskelijaa pidetään opetuksen kohteena ja suorittajana (Ihanainen et
al, 2004). Tässä mallissa opetustavoitteet ovat tarkkaan määritelty, opettaja suodattaa
materiaalin valmiiksi ja opiskelija vastaanottaa tiedon passiivisesti. Keskeisiä periaat-
teita ovat lisäksi ärsyke – reaktio -kytkentä, oikeiden suoritusten vahvistaminen, vir-
heellisten vastausten nopea ohittaminen ja opetettavan aineksen jakaminen mitattaviin
osioihin.
Nykykäsityksen mukaan behavioristinen oppimiskäsitys on vanhentunut ja sille löytyy
parempiakin vaihtoehtoja (Lepistö, 2008). Verkko-opetuksessa se näyttäytyy liian
8
suunnittelupainotteisena lähestymistapana opetuksen suunnitteluun. Odottamattomille
käänteille ei jätetä kehitystilaa eikä opiskelijakohtaista mukautumista tapahdu ja ope-
tuksessa keskitytään suoritettaviin tehtäviin eikä itse tehtävien tarkoitukseen. (Emin-
Martínez et al., 2014)
Kognitiivinen oppimiskäsitys
Behaviorismin lisäksi perinteisiin oppimisteorioihin luetaan kognitiivinen oppimiskä-
sitys (Raitala & Ylilehto, 2012). Se perustuu oppijan omiin kognitiivisiin prosesseihin
– oppija itse ohjaa omaa oppimistaan. Sen mukaan oppiminen ei ole pelkkää tiedon
varastointia ja ulkoisiin ärsykkeisiin reagoimista vaan ennemminkin se on tiedon han-
kintaa ja prosessointia. Eri asioita opitaan eri tavalla ja oppiminen on sosiaalista. Ope-
tuksen tarkoituksena tukea aktiivista oppimista ja opettajan ja opiskelijan välistä kom-
munikaatiota, lisätä opiskelijoiden välistä yhteistyötä ja antaa täsmällistä ja kannusta-
vaa palautetta. Opetuksessa otetaan myös huomioon erilaiset lahjakkuudet ja oppimi-
sen tavat sekä asetetaan tavoitteet korkealle (Lepistö, 2008). Verrattuna behavioris-
miin, oppijan rooli aktivoituu ja hän ottaa vastaan tietoa, tekee havaintoja, taltioi tietoa
valikoivasti ja tekee tulkintoja (Pylkkä, 2010). Opettajan roolina on vuorovaikutusten
ja kognitiivisten mallien kehittymisen ohjaaminen (Manninen, 2001).
Verkko-opetus mahdollistaa kustannustehokkaan tavan hyödyntää kognitiivisen oppi-
miskäsityksen periaatteita mm. vuorovaikutteisten, opiskelijakeskeisten oppimateriaa-
lien avulla. Oppimateriaaleihin voidaan lisätä esim. simulaatioita oikeista tilanteista,
joita voi kokeilla ratkaista ja kerrata yhä uudestaan. (Greitzer, 2002)
Konstruktivistinen oppimiskäsitys
Konstruktivismi on muunnelma kognitivismista ja perustuu humanistiseen ihmiskäsi-
tykseen, tiedon suhteellisuuden käsitykseen ja näkemykseen oppijasta aktiivisena tie-
donrakentajana (Auvinen et al, 2007). Viimeisen kahden vuosikymmenen aikana huo-
mio on opetuksessa siirtynyt juuri konstruktivismiin, koska tukee aktiivista oppimista
tiedon rakentamisen avulla. (Koohang, Riley, Smith, & Schreurs, 2009)
9
Humanistisen ihmiskäsityksen mukaan ihmisen kyky ohjata omaa oppimistaan, käsi-
tys omasta itsestään ja itsereflektiiviset valmiudet, kuten itseen suuntautuva mietiskely
ja harkinta, ovat opittavia ominaisuuksia. Subjektiivisista kokemuksista syntyy objek-
tiivista tietoa sosiaalisen vuorovaikutuksen ja oppijoiden keskinäisen yhteistoiminnan
kautta (Pylkkä, 2010). Tieto on suhteellista, koska absoluuttista tai kiistatonta totuutta
ei ole, joten jokainen todellisuuskuva on arvokas ja luotettava - sama asia voidaan
tulkita tai käsittää monella eri tavalla. Näin ollen sitä ei voi behavioristisesti siirtää
oppijalle. Konstruktivismin perusprosessi onkin oppijan tiedon konstruoiminen eli tie-
don rakentaminen vanhan tietopohjan päälle. Tieto jäsennetään omien kokemuksien
kautta ja ymmärtäminen liittyy aina johonkin tilanteeseen. Toimintaa ohjaa tavoite,
joka taas määritellään oppimisen kriteereissä, mutta itse oppiminen on oppijan oman
toiminnan tulosta (Lepistö, 2008; Manninen, 2001).
Konstruktivistinen oppimiskäsitys sopii erityisen hyvin verkko-opetukseen, sillä se
varmistaa opiskelijoiden oppimisen (Koohang et al., 2009). Verkko-opetuksen keskus-
telufoorumit ja muu yhteisöllinen oppiminen edustavat myös konstruktivistista oppi-
miskäsitystä, jossa tietoa ei siirretä ihmiseltä toiselle vaan opiskelija on aktiivinen osa-
puoli oppimisessa. (Harris & Sandor, 2007)
Realistinen oppimiskäsitys
Realistisessa oppimiskäsityksessä ei ole yhtä ainoata opetustapaa vaan sen mukaan
erilaiset näkemykset tulisi nähdä toisiaan täydentävinä näkökulmina. Näin ollen esi-
merkiksi behavioristista oppimiskäsitystä ei voida suoraan hylätä, vaan sitä voidaan
hyödyntää esimerkiksi oppimisvaikeuksista kärsivien opiskelijoiden kohdalla. Toisin
kuin konstruktivismissa, realismin mukaan kaikki tieto ei ole suhteellista, vaan on ole-
massa pysyviä totuuksia ja opetuksen tarkoituksena on auttaa opiskelijoita muodosta-
maan käsityksiä, taitoja, tottumuksia ja asenteita, jotka vastaavat tätä todellisuutta ja
sen asettamia vaatimuksia. Tietoa rakennetaan aktiivisesti ja vanhaan pohjaten, mutta
samalla edellytetään näiden rakenteiden pätevyyden arviointia. Realismi myös sallii
oppijan epätäydellisyyden ja tunnustaa hänen tarpeensa toisten tukeen ja ohjaukseen.
(Auvinen et al., 2007)
10
Kirjallisuudesta ei löytynyt esimerkkejä tämän oppimiskäsityksen soveltamisesta
verkko-opetukseen.
2.2.2 Pedagogisia malleja
Erilaisia pedagogisia oppimiskäsityksiä voidaan toteuttaa pedagogisilla malleilla. Ne
jäsentävät oppimisprosessin etenemistä ja kuvaavat miten oppiminen pedagogisten pe-
riaatteiden mukaan käytännössä tapahtuu. Ne eroavat lähinnä painotuseroissa ja käy-
tännöissä. Niitä voidaan myös yhdistellä ja soveltaa tilanteiden mukaan. Tämän hetken
verkko-opetuksessa yleisimmät pedagogiset mallit ovat tutkiva, keksivä ja ongelma-
keskeinen oppiminen.
Tutkiva oppiminen
Tutkivan oppimisen tarkoitus on saada opiskelijat osallistumaan yhteisölliseen tiedon-
luomisen prosessiin, jossa kysymykset käsiteltävästä asiasta perustuvat opiskelijoiden
omiin ennakkokäsityksiin ja aiempiin tietoihin. Prosessi syvenee asteittain, kun kysy-
myksiä ja selityksiä tarkennetaan tietolähteiden avulla. Yhteisöllisyys on olennaista –
opiskelijat jakavat tietoa keskenään ja opettelevat jatko-kehittämään selityksiä jaetusta
tiedosta sekä tukemaan toistensa ajattelua.
Tutkivan oppimisen prosessi alkaa kontekstin luomisesta, jonka tarkoitus on moti-
voida opiskelijoita ja luoda perusta oppimiselle, jonka jälkeen opiskelijat itse asettavat
tutkimuskysymykset. Opettaja ohjaa keskustelua mielekkääseen suuntaan, mutta opis-
kelijat itse asettavat ne kysymykset, joita he haluavat tutkia. Sen jälkeen opiskelijoiden
tulee paljastaa omat ennakkokäsityksensä ja aikaisemmat tietonsa valituista kysymyk-
sistä muodostamalla niistä työskentelyteorioita eli hypoteeseja. Tämä rohkaisee heitä
aktiivisesti ajattelemaan ongelmaa eikä vain passiivisesti ottamaan vastaan informaa-
tiota. Verkko-oppimisympäristön yhteiset työskentelyfoorumit antavat hyvän ympä-
ristön työskentelyteorioiden julkaisemiseen sekä erilaisten selitysten ja tulkintojen
vertailemiseen.
Luotuja teorioita kehitetään nostamalla niistä esiin epäselvyyksiä tai puutteellisuuksia.
Työskentelyfoorumit ovat tässäkin erittäin hyviä työkaluja, koska ne mahdollistavat
11
kaikille avoimen teorioiden argumentoinnin ja kommenttien tallentamisen. Sitten opis-
kelijat hankkivat lisää syventävää tietoa eri tietolähteistä, tarkentavat sen avulla tutki-
muskysymyksiä ja niiden pohjalta teorioita. Tämä prosessi jatkuu asteittain kohti pro-
sessin tulosten yhteenvetoa ja selitysten julkaisemista.
Verkko-oppimisympäristö tukee hyvin tutkivaa oppimista tarjoamalla eräänlaisen
”kollektiivisen työpöydän” opiskelijoiden tuottamalle tiedolle, sen jakamiselle ja ke-
hittelylle. Verkon avustuksella myös asiantuntijoiden on helppo osallistua oppimisen
prosessiin. Verkkofoorumeiden ja tiedostonjaon lisäksi yhteisöllistä tiedonluonnin
prosessia helpottaa tehokas tiedostojen versionhallinta, dokumenttien yhteismuokkaus
ja tietokohteiden uudelleenjärjestely. (Lakkala, 2002; Raitala & Ylilehto, 2012;
Veermans, 2004)
Keksivä oppiminen
Keksivän oppimisen seurauksena on tarkoitus, että oppija kokee keksineensä jotain
uutta, henkilökohtaisesti mielekästä ja kiinnostavaa. Se erottuu omaksi malliksi juuri
tämän henkilökohtaisen oppimisprosessin painottamisen ansiosta. Sitä yleensä käyte-
tään jonkin tietyn periaatteen tai ilmiön oppimiseen ja keksivän oppimisen taitojen
käyttämiseen uudelleen uusissa yhteyksissä ja tilanteissa.
Konstruktivistisen oppimiskäsityksen yleistyminen on tehnyt tätä mallia suosituksi,
mutta siihen on vaikuttanut myös laajentunut ja monipuolistunut tietotekniikan käyttö.
Keksivää oppimista käytetään etenkin luonnontieteissä, joissa käytetään simulaatioita
mallintamaan monimutkaisia luonnonlakeja ja -ilmiöitä.
Keksivän oppimisen prosessi koostuu viidestä vaiheesta tai aliprosessista: ongelman
määrittäminen, hypoteesin kehittäminen, kokeen suunnitteleminen ja hypoteesin tes-
taaminen, yhteenveto ja regulaatio. Nämä vaiheet tulisi tehdä opiskelijalle näkyväksi,
jotta he pystyvät monitoroimaan omaa oppimistaan. Se voidaan tehdä graafisen työ-
kalun avulla, joka tallentaa eri prosessit, niiden väliset suhteet ja suhteiden muutokset.
Keksivää oppimista voidaan tukea käyttämällä erilaisia simulaatioita, kuten esimer-
kiksi SimQuest. Sen avulla voidaan rakentaa simulaatioiden ympärille rakentuvia
12
verkko-oppimisympäristöjä, jotka tarjoavat opiskelijalle yksilöllistä palautetta sekä
oppimista tukevia toimintoja, kuten esim. tehtäviä, selityksiä ja monitorointityökaluja.
(Veermans, 2004)
Ongelmakeskeinen oppiminen
Ongelmakeskeinen oppiminen on käytännönläheistä ja se on kehitetty työelämän nä-
kökulmasta. Siinä lähdetään liikkeelle huolellisesti suunnitelluista ongelmista, jotka
ovat samankaltaisia kuin opiskeltavan aihepiirin todelliset ongelmat. Ne pohjautuvat
usein ”tapauksiin” (eng. case) ja niissä kuvataan ilmiöitä tai tapahtumia, joille tarvitaan
selitys. Erotuksena muiden opetusmenetelmien ongelmanratkaisuun, tapausten ongel-
mat eivät ole valmiiksi strukturoituja eikä niille välttämättä ole ratkaisua tai niille voi
olla monta ratkaisua.
Ongelmakeskeisen oppimisen mallissa oppiminen perustuu ryhmätyöskentelyyn on-
gelman ymmärtämiseksi tai ratkaisemiseksi. Opiskelijat perehtyvät kukin joihinkin
ongelman erityispiirteisiin ja oleellista on, että ryhmässä keskustellaan yhteisesti sekä
opiskellaan yhteisesti ja yksilöllisesti ratkaisua ongelmaan. Tämä työtapa tuottaa on-
gelmanratkaisun edellyttämää jaettua asiantuntijuutta. Opiskelijoilla on apunaan tutor,
joka vie prosessia eteenpäin, korjaa syntyneitä vääriä käsityksiä tai ratkaisuja sekä tu-
kee opiskelua mm. asiantuntijuudella, kontakteilla ja autenttisilla materiaaleilla.
Ongelmakeskeinen oppimisprosessi alkaa ongelmatilanteen kuvauksella, joka on
usein moniulotteinen. Sitä seuraava prosessi kulkee seitsemän eri vaiheen kautta: kä-
sitteiden ja termien selvittäminen, ongelman määrittely, aivoriihi, ongelman analy-
sointi ja hypoteesin kehittäminen, oppimistavoitteiden määrittely (eli mistä tarvitaan
tietoa), tiedon hankinta sekä ryhmäkeskustelu.
Verkko-opetuksessa ongelmanratkaisuprosessia voi mallintaa ja ohjata tuottamalla
verkkoon pohja, joka kuvaa ongelmaratkaisun eri vaiheita ja johon opiskelijat voivat
tuottaa eri vaiheiden aikana syntyvää tietoa, ajatuksia, kuvia yms. Tällainen pohja tu-
kee työskentelyprosessia ja auttaa jäsentämään ratkaisun vaiheita. Voidaan käyttää
myös virtuaalisia esimerkkejä, kuten esim. lääketieteen opetuksessa virtuaalipotilasta,
13
joka saattaa itsessään olla ratkaisua vaativa ongelma. Se voi olla toteutettuna videona
ja potilaan lisätiedot voidaan antaa esim. todenmukaisina laboratoriotuloksina. Myös
koko ongelmanratkaisuprosessi voidaan toteuttaa verkkokurssina, jolloin opiskelija-
ryhmä toteuttaa koko prosessin verkossa erilaisten virtuaalisten työkalujen avulla.
(Veermans, 2004)
2.2.3 Verkko-oppimisympäristöjen eri tasot
Verkko-oppimisympäristöt voidaan jäsentää eri tasoihin verkko-opetuksen yhteisölli-
syyden perusteella (Raitala & Ylilehto, 2012). Ensimmäisellä tasolla verkkoympäristö
toimii vain materiaalipankkina, jonka avulla välitetään informaatiota. Toisella tasolla
verkkoa hyödynnetään myös opettajan ja opiskelijan väliseen viestintään, kuten esi-
merkiksi tehtävien palautukseen ja oppimisen palautteeseen. Kolmannella tasolla opis-
kelijat ovat vuorovaikutuksessa myös keskenään. Yhteisöllisissä työskentelytilan-
teissa jaetaan ideoita sekä tuotoksia ja kommentoidaan niitä. Neljännellä tasolla opis-
kelijoiden vuorovaikutus painottuu oppisisällön sijaan suoraan keskinäiseen kommu-
nikointiin. Opiskelijat vaihtavat ajatuksia ja ideoita sovitusta aihepiiristä ja voivat esi-
merkiksi tuottaa yhdessä kehitellyn ratkaisun johonkin avoimeen ongelmaan. Kor-
keimmalla viidennellä tasolla ratkaisuja ja tuotoksia kehitetään pitkäjänteisesti yh-
dessä, jolloin tiettyjen oppisisältöjen hallinta tulee ikään kuin toiminnan sivutuotteena.
2.2.4 Oppimisaihiot
Verkko-opetus on mahdollista käyttää itsenäisiä digitaalisen oppimisen resursseja eli
oppimisaihioita. (Ilomäki, 2008; Opetushallitus, 2011) Oppimisaihio on pienimuotoi-
nen, tiettyihin oppimistilanteisiin soveltuva, opiskelijaa aktivoiva oppimateriaalikoko-
naisuus. Ne on tarkoitettu helposti jaettaviksi, löydettäviksi ja uudelleenkäytettäviksi
ja niiden avulla on pyritty kustannustehokkuuteen oppimateriaaleissa. Esimerkkejä
niistä ovat muun muassa animaatiot, simulaatiot tai pienimuotoiset oppimispelit. Opis-
kelija hyötyy oppimisaihioista opiskelun joustavuuden kautta, koska niillä voidaan li-
sätä opiskelun aika- ja paikkariippumattomuutta. Oppimisaihiot myös tukevat yksilöl-
lisiä opiskelutarpeita sekä yhteisöllistä työskentelyä.
14
2.3 Verkko-opetuksen hyötyjä ja haittoja
Tässä luvussa käsitellään verkko-opetuksen erilaisia hyötyjä ja haittoja perinteiseen
luokkaopetukseen verrattuna. Hyödyt kerrotaan ensin ja niitä tasapainotetaan sen jäl-
keen haittapuolien esittelemisellä.
2.3.1 Hyötyjä
Verkko-opetus on perinteistä opetusta joustavampaa, niin ajallisesti kuin maantieteel-
lisestikin. Kun opiskelija suorittaa kurssia itsenäisesti, hän voi suorittaa opintoja silloin
kun hänelle itselleen parhaiten sopii, kunhan noudatetaan kurssille asettuja aikataulu-
rajoitteita. Tämä joustavuus on myös kustannustehokasta, kun opiskelijoiden ja opet-
tajien ei tarvitse matkustaa eikä opetus vaadi fyysisiä opiskelutiloja. Myös henkilö-
kuntaa vaaditaan opiskelijaa kohden vähemmän kuin perinteisessä opetuksessa.
Verkko-opetuksessa myös asiantuntijoiden hyödyntäminen on helpompaa. Tämä joh-
tuu siitä, että verkkoluennot voi tallentaa ja niihin voi myöhemmin palata itsenäisesti.
Vierailevia asiantuntijoita voidaan myös integroida opetukseen interaktiivisten simu-
laatioiden tai vuorovaikutusympäristöjen avulla.
Tiedon jakaminen on verkko-opetuksessa helppoa, koska verkossa tieto voidaan koota
yhteen paikkaan, johon kaikilla opiskelijoilla on pääsy. Tämä jättää lisää aikaa opis-
kelulle, sillä verkossa kurssimateriaali on aina saatavilla toisin kuin lähiopetuksessa,
jolloin opiskelijan täytyy olla läsnä materiaalia jaettaessa. Myös opiskelijoiden tuot-
tama tieto on luonnollisempaa jakaa verkon välityksellä kuin esimerkiksi kopioida ja
jakaa muistiinpanoja koko kurssiryhmälle.
Verkko-opetuksessa voidaan hyödyntää verkon aika- ja paikkariippumattomuutta
myös opiskelijoiden ja opettajien vuorovaikutuksessa. Verkko toimii sosiaalisena toi-
mintaympäristönä, jossa opiskelijat keskustelevat, tuottavat ja vertailevat materiaalia
sekä ottavat kantaa muiden tekemään materiaaliin. Verkossa opiskelijalle jää myös
enemmän aikaa ajatella, kun vastausta ei tarvitse tuottaa heti kysyttäessä. Verkkoym-
päristössä keskustelu ohjautuu enemmän käsiteltävään asiaan kuin ryhmäsuhteisiin ja
15
vuorovaikutuksen rakenne muuttuu opettaja-opiskelija-suhteesta enemmän opiskeli-
joiden väliseen ja opettajan väliseen vuorovaikutukseen. Keskustelut tallentuvat verk-
koon, jossa niihin voi myöhemmin palata ja ottaa osaksi oppimateriaalia.
Yhteisön sosiaalisen tuen merkitys korostuu verkko-opiskelussa, sillä verkko-opetuk-
seen osallistuvilla opiskelijoilla herää tarve yhteistyöhön ja sosiaaliseen vuorovaiku-
tukseen. Yhteisöllisyys ja yhdessä tekeminen aktivoi ja motivoi opiskelijoita. Ver-
kossa yhteisön tasa-arvo korostuu, sillä verkkokeskusteluissa kaikkien ääni on saman
arvoinen ja esimerkiksi luokkahuoneen hiljaisimmat voivat osallistua tasa-arvoisesti
keskusteluun. (Tervo, 2012)
Datatieteen avulla verkko-oppimisympäristö soveltuu reflektiiviseen oppimiseen,
jossa opiskelija voi itse nähdä suoritushistoriansa ja oppimisensa edistymisen. Tämä
on yksi tärkeimpiä asioita tämän tutkielman kannalta. Lähtötasotestit ja oppimisen seu-
ranta antavat suoraa palautetta opiskelija ja opettajalle. Myös verkko-oppimisympäris-
töjen raportointimahdollisuudet tuottavat arvokasta tietoa ja mittareita opiskelijan mo-
tivaatiosta, opettajan suorituksessa ja verkko-opetuksen toiminnasta. Raporteilla on
myös todettu positiivinen vaikutus kurssin lopputulokseen. (Arkorful & Abaidoo,
2015; Tervo, 2012)
2.3.2 Haittoja
Verkko-opetukseen liittyy myös haittoja verrattuna perinteiseen opetukseen. Verkko-
opetus asettaa uudenlaisia vaatimuksia, jotka täytyy ottaa huomioon oppimateriaalin
suunnittelussa, etenkin muokattaessa olemassa olevaa materiaalia verkkoon sopivaksi.
Verkossa materiaalia luetaan silmäillen, joten tekstisisältö täytyy jäsentää eri tavalla
verrattuna perinteiseen oppimateriaaliin. Verkko mahdollistaa myös eri medioiden
käytön oppimateriaalissa, mutta niiden käyttö täytyy suunnitella hyvin, jotta koko-
naisuus pysyy johdonmukaisena. (Pirilä, 2013)
Verkko-opetuksessa on kiinnitettävä erityistä huomiota sosiaaliseen vuorovaikutuk-
seen, koska sen tuottama dialogi on paras tapa kehittää argumentointitaitoja ja kriittistä
ajattelua. Sosiaalinen vuorovaikutus syntyy luonnostaan lähiopetustilanteissa, mutta
verkkoympäristöissä se usein unohtuu ja vuorovaikutus keskittyy enemmän muihin
16
asioihin, kuten kognitiivisiin prosesseihin ja yhteiseen tiedonrakentamiseen. (Nevgi et
al., 2005)
Koska verkko-oppiminen vaatii itsenäistä työtä eikä aina edellytä sosiaalista vuorovai-
kutusta, se vaatii opiskelijalta hyvää motivaatiota ja ajanhallintakykyä. (Arkorful &
Abaidoo, 2015) Kommunikaatio saattaa olla joillekin hankalampaa verkossa, jolloin
opiskelijan taitotaso ei välity muille. Verkko-oppimisympäristöissä myös erilainen
huono toiminta, kuten huijaaminen, on mahdollista ja siitä kiinnijäämisen riski pie-
nempi.
Alati läsnä oleva teknologia on myös johtanut huomion jatkuvaan hajaantumiseen ja
keskittymiskyvyn heikentymiseen (Small & Vorgan, 2008). Jatkuva huomion jakau-
tuminen voi johtaa aivojen stressitilan kohoamiseen, joka pitkään jatkuessa heikentää
kognitiivisia prosesseja ja aiheuttaa masennusta.
17
3 Datatiede
Tässä luvussa keskitytään datatieteeseen. Luvussa 3.1 määritellään datatiede ja siihen
liittyvät termit, jonka jälkeen luvussa 3.2 keskitytään datatieteen syntyhistoriaan ja
syihin miksi se on noussut merkittäväksi juuri nyt. Luvussa 3.3 esitellään datatieteen
nykyisiä käyttökohteita ja luvussa 3.4 tutustutaan tarkemmin datatieteen prosessiin.
Viimeisessä luvussa 3.5 tarkastellaan datatieteen kehityssuuntia.
3.1 Määritelmät
Tässä luvussa pyritään saamaan selville datatieteen konteksti ja mitä datatiede tarkoit-
taa. Ensin käydään läpi mitä tiedolla, ja sen eri tasoilla, tarkoitetaan, jonka jälkeen
määritellään Big Data -termi. Lopuksi yritetään saada datatieteelle selkeä määrittely.
3.1.1 Tiedon eri tasot
Tieto on hyvin laaja-alainen käsite. Se koostuu eri tasoista, joita ovat data, informaa-
tio, tietämys ja ymmärrys, jotka ovat kuvattu kuvassa 1. Tieto kumuloituu ja jalostuu
liikuttaessa datasta informaation kautta tietämykseen ja edelleen ymmärrykseen.
(Ilvonen, Jussila, & Kukko, 2013; Jokela, 2011)
18
Kuva 1: Tiedon eri tasot ovat data, informaatio, tietämys sekä ymmärrys. (Jokela, 2011)
Data tarkoittaa jonkin ”asian säännönmukaista esitystä käsittelykelpoisessa muo-
dossa” (Kotimaisten kielten keskus, 2016). Se on rakenteetonta, objektiivista tietoa,
jota kerättäessä tallennetaan säilytystä varten tietokantoihin tai hieman organisoidum-
min tietovarastoihin (Ilvonen et al., 2013). Data-sana on lähtöisin latinan kielen sanasta
datum, ’annettu’. Data-sanaa on käytetty nykyisessä kontekstissaan 1940-luvulta läh-
tien, kun tietokoneilla on alettu käsitellä tietoa. (Stanton, 2013)
Datalla ei sinänsä ole merkitystä, vaan se tarvitsee aina tulkintaa. Eri järjestelmät ja
sovellukset luovat datasta informaatiota (eng. information) luomalla sille rakenteen,
sisällön ja merkityksen, joka mahdollistaa sen analysoinnin. (Ilvonen et al., 2013;
Jokela, 2011)
Data ja informaatio ovat objektiivista, helposti välitettävissä olevaa tietoa. Tietämys
(eng. knowledge) taas on inhimillistä tietoa, joka syntyy tulkittaessa oppimisen ja
omaksumisen avulla merkitykselliseksi koettua informaatiota. (Ilvonen et al., 2013)
19
Ymmärrys (eng. wisdom) on tiedon ylin muoto ja se saavutetaan, kun tietämyksen
käsittelyä jatketaan aiempien kokemusten, arvojen ja tavoitteiden pohjalta. Ymmär-
ryksellä tarkoitetaan kykyä soveltaa tietämystä sekä saatavilla olevaa informaatiota
ongelmanratkaisussa tai tehtävän suorittamisessa. Ymmärrystä syntyy, kun vertail-
laan, tehdään johtopäätöksiä ja keskustellaan. (Ilvonen et al., 2013)
3.1.2 Big data
Big Data on sana, jolla ei myöskään ole tarkkaa määritelmää. Yleisesti voidaan sanoa,
että Big Data on suhteellinen, ei absoluuttinen, termi. Sillä tarkoitetaan suurta määrää
dataa, mutta suurta ei tässä yhteydessä määritellä. Sille ei anneta lukua, esim. 1 peta-
tavu < Big Data. Data on suurta silloin, kun sen käsittelystä tulee haasteellista. (Schutt
& O’Neil, 2013)
Big Dataa voidaan luonnehtia nk. neljällä V:llä: Volume (määrä), Velocity (nopeus),
Variety (muoto) ja Veracity (todenmukaisuus), jotka löytyvät kuvan 2 kohdasta ”Big
Data”.1 Big Datan määrä on nimensä mukaisesti suurta. Dataa syntyy joka päivä 2,5
exabittiä eli 2500 petabittiä ja 90% maailman datasta on syntynyt viimeisen kahden
vuoden aikana. Dataa syntyy yhä nopeammin, sillä vuonna 2013 dataa syntyi 28,9 te-
ratavua sekunnissa ja vuonna 2018 sitä on ennustettu syntyvän jo 50 teratavua sekun-
nissa eli tuotetun datan määrä lähes kaksinkertaistuu viidessä vuodessa. 90% Big Da-
tasta on jäsentämätöntä dataa, kuten esim. valokuvia, videoita tai keskustelupalstan
kommentteja. (B. Walker, 2015) Jäsentämätön data on nimensä mukaisesti merkittä-
viltä osin epävarmaa ja epätarkkaa. Kerättävän datan nopeus osaltaan kasvattaa tätä
ongelmaa, sillä aikaa ei enää riitä datan jäsentämiseen esikäsittelyssä. (M. Walker,
2012a)
1 Eri lähteet määrittelevät eri lukumäärän V-alkuisia termejä ja ne voivat olla toisistaan hieman poik-
keavia. Määrät vaihtelevat lähteestä riippuen kolmen ja kymmenen välillä. Luetellut neljä termiä ovat
kuitenkin yleisimmät.
20
Kuva 2: Big Datan "viisi V:tä": Volume, Velocity, Variety, Veracity, Visibility sekä Value.
(Quitzau, 2014)
IBM on lisännyt edellä lueteltuihin Big Datan ominaisuuksiin kaksi V-alkuista termiä
lisää: Visibility (näkyvyys) ja Value (arvo), jotka löytyvät kuvan 2 kohdasta ”Open
Data”. Näkyvä data on avointa kaikille, joka aiheuttaa huolta yksityisyyden, turvalli-
suuden ja alkuperän kannalta. Datan arvo riippuu sen analysoinnista eli sama data eri
tavalla käytettynä voi olla arvokkaampaa kuin toisella tavalla käytettynä. (Marr, 2014;
Quitzau, 2014)
3.1.3 Datatiede
Datatiede on uusi termi, jolla ei vielä ole vakiintunutta määritelmää. Sillä kuvataan jo
yleisesti työpaikkoja tai tutkintoja, jotka sisältävät datan keräämistä, tulkitsemista ja
havainnollistamista. (Harvard, 2016; Schutt & O’Neil, 2013)
Datatieteen yhteydessä on käytetty myös termiä datan louhinta (eng. Data Mining)
sekä tietämyksen louhinta (eng. Knowledge Discovery) ja joskus myös tietämyksen
21
louhinta tietokannoista (eng. Knowledge Discovery in Databases, KDD). Tietämyk-
sen louhinta on prosessi, jonka avulla etsitään käyttökelpoista tietoa datasta. Datan
louhinta on sen prosessin osa, jossa datasta louhitaan hahmoja soveltamalla siihen tiet-
tyjä algoritmeja. (Fayyad, Piatetsky-Shapiro, & Smyth, 1996) KDD-prosessi on hyvin
samankaltainen datatieteen prosessin kanssa (Schutt & O’Neil, 2013) ja datatieteilijä
Gregory Piatetsky-Shapiro onkin sitä mieltä, että se on vain yksi uusi termi kuvaamaan
samaa kuin KDD eli datan analysointia. (Piatetsky-Shapiro, 2012)
Informaatiojärjestelmien professori Vasant Dharin mukaan datatiede on poikkitieteel-
linen ala koskien järjestelmiä ja prosesseja, joiden avulla louhitaan datasta tietämystä
tai oivalluksia joko rakenteellisessa tai ei-rakenteellisessa muodossa ja, joka on jatkoa
sellaisille data-analytiikan aloille kuin tilastotiede, datanlouhinta ja ennustava analy-
tiikka, samoin kuin KDD. (NYU, 2013)
Eräs toinen laajalti viitattu määritelmä datatieteelle määrittelee sen alaksi, joka sijait-
see tilastotieteen, ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. Ku-
vassa 3 datatieteen sijainti kuvataan Venn-kaavion avulla. (Conway, 2015; Schutt &
O’Neil, 2013)
22
Kuva 3: Datatieteen sijainti Venn-kaavion avulla kuvattuna. Datatiede sijaitsee tilastotieteen,
ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. (Conway, 2015)
Kaikkia kaaviossa kuvattuja kolmea alaa tarvitaan datatieteessä. Perinteinen tutkimus
on tässä kaaviossa kuvattu yhdistelmäksi matematiikan ja tilastotieteen teoriaa ja ala-
kohtaista tuntemusta. Conway väittää, että tämä voi johtua akateemisesta kulttuurista,
joka ei perinteisesti ole palkinnut teknologian ymmärrystä. Ilman alakohtaisen tunte-
muksen antamaa kontekstia ja tutkimuskysymyksiä, datatieteestä jää jäljelle vain ko-
neoppiminen. Ohjelmointi ja alakohtainen tuntemus ilman tuloksia selittävää mate-
maattista teoriaa johtaa vaaralliseen tilanteeseen, jossa päällisin puolin päteviltä vai-
kuttavia analyysejä ei osata tulkita oikein ja se voi johtaa vääriin toimenpiteisiin.
(Conway, 2015)
23
Datatiede eroaa perinteisestä datan analysoinnista esimerkiksi tilastollisin keinoin
siinä, että tilastotieteessä pyritään selittämään ilmiö tarkastelemalla yksittäisissä data-
joukoissa esiintyviä hahmoja, kun taas datatiede pyrkii tekemään datasta ennusteita ja
tuottamaan tietoa päätöksenteon tueksi. (Wladawsky-Berger, 2014)
Datatiede on myös tilastotiedettä vapaampaa siinä suhteessa, että se ei pyri olemaan
niin eksaktia vaan sallii suuremman virhemarginaalin tai mallin poikkeaman saavut-
taakseen nopeammin toimeenpantavia tuloksia. Tehokkuus ja ROI ovat tärkeimpiä
ominaisuuksia, kuten myös ratkaisujen vakaus, skaalautuvuus sekä tulosten tulkitta-
vuus. (Granville, 2014)
3.2 Datatieteen historia ja nykytila
Tässä luvussa pyritään vastaamaan kysymykseen: mistä datatiede kumpuaa? Ensin tut-
kitaan datatieteen syntyhistoriaa ja sen jälkeen datatieteen kasvuun vaikuttaneita teki-
jöitä.
3.2.1 Datatieteen juuret
Datatiede on lähtöisin kypsän tilastotieteen alan ja nuoren tietojenkäsittelytieteen yh-
distämisestä. Vuonna 1977 kansainvälisen tilastoinstituutin (International Statistical
Institute ISI) jaostoksi perustettiin laskennan alajaosto (International Association for
Statistical Computing IASC), jonka tehtävänä on muuttaa data informaatioksi ja tietä-
mykseksi yhdistämällä perinteiset tilastomenetelmät ja moderni tietokoneteknologia
alakohtaisten asiantuntijoiden tietämykseen. (Press, 2013)
Vuonna 1989 Gregory Piatetsky-Shapiro järjesti ensimmäisen Knowledge Discovery
in Databases (KDD) -työpajan, josta vuonna 1995 tuli vuosittainen ACM SIGKDD
tiedonlouhinnan konferenssi. SIGKDD on datalouhinnan, -tieteen ja -analysoinnin yh-
teisö. (Press, 2013)
Vuonna 1994 yhdysvaltalainen talouslehti Businessweek kertoi kansitarinassaan tie-
tokantamarkkinoinnista (Database marketing), jossa yritykset keräsivät paljon tietoa
asiakkaistaan. Tiedon avulla ennustettiin, kuinka todennäköistä oli, että kuluttaja ostaa
24
jonkin tuotteen ja tuleva markkinointi suunniteltiin sen ympärille. Ongelmana kuiten-
kin siihen aikaan oli niin suuren tietomäärän käsittely vaikeus. (Berry, 1994)
Ensimmäistä kertaa datatiede-termi esiintyi konferenssin nimessä vuonna 1996, kun
IFCS (International Federation of Classification Societies) järjesti konferenssinsa ni-
mellä ”Data science, classification and related methods”. (Press, 2013)
Vuosina 2002 ja 2003 julkaistiin ensimmäistä kertaa kaksi datatiedettä käsittelevää
tieteellistä julkaisua, Data Science Journal ja Journal of Data Science. Datatiede sai
oman tutkimuskeskuksensa Fudanin yliopiston yhteyteen vuonna 2007 nimellä ”The
Research Center for Dataology and Data Science”.
Brittiläinen ei-kaupallinen yhdistys Jisc (ent. Joint Information Systems Committee)
määritteli datatieteilijät vuonna 2008 henkilöiksi, jotka ”työskentelevät siellä missä
tutkimusta suoritetaan, tai, tietokeskushenkilökunnan tapauksessa, lähellä paikkaa,
jossa data tuotetaan” ja jotka ”tuottavat luovia kyselyjä tai analyysejä, mahdollistaen
muiden työskentelyn digitaalisen datan kanssa ja edistyksen tietokantateknologiassa”.
(Swan & Brown, 2008)
2010-luvulla saavuttiin nykyisenlaiseen määritelmään datatieteilijästä eli hän on hen-
kilö, joka ”käyttää niin dataa kuin tiedettäkin luodakseen jotain uutta”. (Patil, 2011)
3.2.2 Syyt yleistymiselle
Datatiede on yleistynyt juuri nyt, koska tiedon, teknologian ja liiketoiminnan odotuk-
set suuntautuvat analysoimaan ja käyttämään kasvanutta datamäärää. (Upadhyaya,
2014) Aiemmin mainitusta kerätyn datan määrän räjähdysmäisestä kasvusta johtuen,
dataa on paremmin saatavilla. Uudet teknologiat mahdollistavat entistä kustannuste-
hokkaamman datanhallinnan, -säilömisen kuin -käsittelynopeudenkin. Uusien työka-
lujen avulla voidaan myös paremmin käsitellä yhä kasvavaa joukkoa muodoltaan mo-
ninaista dataa sekä kehittäminen ja ottaa käyttöön tietomalleja entistä tehokkaammin.
Liiketoiminnan odotukset ovat myös suuntautuneet hyödyntämään teknologian avaa-
mia uusia mahdollisuuksia, kuten vasteaikojen pienentämistä tai asiakkaan yksilöllistä
25
tunnistamista ja käyttäytymisen ennustamista sekä sen pohjalta viestimistä. (Schutt &
O’Neil, 2013)
Kuva 4: Datatieteen nousuun vaikuttavat tekijät ovat data, teknologia sekä liiketoiminnalliset
tarpeet. (Upadhyaya, 2014)
Datatieteen yleistymiseen johtavia tekijöitä on avattu kuvassa 4. Datan saatavuuden
kasvu sekä teknologian uudet mahdollisuudet selviytyä suurten datamäärien analy-
soinnista järkevin kustannuksin ovat osaltaan edistäneet datatieteen esiinmarssia.
Myös yritysten kilpailutilanne, joka vaatii digitaalisen kokemuksen huomioon otta-
mista ja uusia palvelumalleja, on siihen vaikuttanut. (Upadhyaya, 2014)
3.3 Datatieteen käyttökohteet
Datatiedettä voidaan käyttää hyvin laaja-alaisesti. Kerättyä dataa käytetään mm. edis-
tämään terveyttä ja terveydenhuoltoa, tehostamaan resurssien käyttöä ja kierrätystä,
vähentämään rikollisuutta ja parantamaan turvallisuutta. Kerätystä datasta muodoste-
taan myös mm. datatuotteita, kuten verkkokauppojen suosittelijajärjestelmiä, verkko-
26
opiskelun yksilöllisesti mukautuvaa materiaalia tai dataan pohjautuvaa politiikkaa.
(Loukides, 2010; Schutt & O’Neil, 2013; B. Walker, 2015)
Ennakoivan analytiikan suurimmat datalähteet liittyvät tulovirtoihin. Vuonna 2012 en-
nustavaa analyysia käyttävien yritysten käyttökohteet olivat markkinointi (65%) ja
myynti (59%) ja suurimmat tietolähteet asiakkaisiin (69%), markkinointiin (67%),
tuotteisiin (55%), myyntiin (54%) ja rahoitukseen (51%) liittyvä data. (Vorhies, 2014)
Lääketiede voi hyötyä valtavasti datatieteen soveltamisesta. Suuria hyötyjä voidaan
saavuttaa etenkin, jos dataa saadaan yhdistettyä ja avattua eri tahojen, kuten sairaaloi-
den ja klinikoiden, tietovarastoista. Dataa voidaan myös kerätä ihmisten käyttämistä
laitteista mm. aktiviteetinseurantaan, jolloin data on oikeellisempaa kuin ihmisten it-
sensä ilmoittama tieto. Terveysalan yritykset, kuten Pittsburgh Health Data Alliance,
ovat jo alkaneet tarjota palveluita kuluttajille, jotka ovat räätälöity yksilöllisesti heidän
vakuutustietojensa, laiteseurantadatan, genetiikan ja jopa sosiaalisen median käyttö-
datan mukaan. Lisääntyneen datan ja koneoppimisen myötä diagnosointi helpottuu ja
jopa diagnoosin mukainen hoito voi olla räätälöity yksilökohtaisesti. Datatieteen
avulla voidaan myös tehostaa jälkihoitoa mm. ennustamalla ketkä potilaat todennäköi-
sesti noudattavat terveydenhuollon ammattilaisen ohjeita ja ketkä eivät. (Marr, 2016a;
Rojas, 2015)
Yksi datatieteen käyttökohteista on markkinointi, jossa sitä hyödynnetään ennusta-
maan asiakkaiden käyttäytymistä ja heidän kulutuskäyttäytymistään. Tämän tiedon
avulla voidaan tehokkaasti markkinoida oikeita tuotteita oikeille henkilöille oikeaan
aikaan, joka johtaa korkeampaan asiakastyytyväisyyteen sekä korkeampaan asiakas-
kohtaiseen tuottoon. (M. Walker, 2013)
Datatiedettä käytetään myös rakennusalalla, jossa on alettu hyödyntämään tietojärjes-
telmiä, jotka mahdollistavat ennustavan, reaaliaikaisen rakennussuunnitelman päivit-
tämisen kustannusarvion raameissa. Tämänkaltaiset tietojärjestelmät nopeuttavat
suunnitteluprosessia vähentämällä tarvetta edestakaiseen kommunikaatioon arkkiteh-
tien, insinöörien ja omistajien välillä. Ne myös vähentävät materiaalihukkaa, joka on
merkittävä menoerä rakennusalalla. Kuten muillakin aloilla, datan vapauttaminen ja
27
kokoaminen eri lähteistä on mahdollistanut sen hyödyntämisen datatieteen keinoin.
(Marr, 2016c)
Datatieteen käyttö vakuutusalalla mahdollistaa uusien tuottomahdollisuuksien tunnis-
tamisen. Asiakaskäyttäytymisen analysointi ja ennustaminen on johtanut kasvaneisiin
tuloihin mm. nopeutuneen laskunmaksun kautta. Datatiedettä voidaan hyödyntää ris-
kiprofiilien muodostamisessa ja mahdollisten vakuutuspetosten tunnistamisessa.
(Pandey, 2014) Liikennevakuutuksien yhteydessä voidaan käyttää reaaliaikaisesti päi-
vittyvää dataa asiakkaiden autoista ja muodostaa datasta yksilöllisiä hinnoittelumalleja
liikennevakuutuksille. Myös kotivakuutusten yhteydessä voidaan muodostaa yksilöl-
lisiä riskiprofiileja asuinpaikan, siitä saatavan julkisen datan ja kodin sisäisten senso-
rien (kosteussensorit, liiketunnistimet, turvakamerat) tuottamaa dataa yhdistämällä.
Niistä voidaan myös tuottaa ennusteita ja sen pohjalta auttaa asukasta varautumaan
mahdollisiin vaaratilanteisiin. Samaa dataa, jota kerätään terveydenhuollon käyttöön,
voidaan myös käyttää terveys- ja henkivakuutusten riskiprofiilien muodostamiseen.
(MastersInDataScience.org, 2016)
Datatieteen sovelluksilla voidaan helpottaa henkilöstöresurssien hallintaa. Näitä sovel-
luksia tarjoavat mm. Oracle, IBM ja SAP. Henkilöstöstä kerättyä dataa voidaan ana-
lysoida ja sen avulla parantaa erilaisia henkilöstöön liittyviä prosesseja, kuten esim.
henkilöstön säilyttämistä, rekrytointia ja koulutusta. Datatieteen avulla voidaan mm.
ennustaa työvoiman muutostarpeita sekä tunnistaa henkilöstön tyytyväisyyttä ja työ-
paikanvaihtohalukkuutta. MITn ja IBMn suorittaman tutkimuksen mukaan HR:ssä da-
tatiedettä soveltavat yritykset kasvattivat myyntiään 8% nopeammin, niillä oli 24%
suurempi nettotuotto ja 58% suurempi työntekijäkohtainen myynti. (Sen, 2016)
Datatiedettä voidaan käyttää jokaisella koulutusasteella ennustamaan oppilaiden suo-
ritustasoa ja tunnistamaan varhain opiskelijat, jotka todennäköisimmin jäisivät jälkeen
opetuksessa. Opetuksen sisältö voi mukautua yksilöllisesti opiskelijan tasoon ja oppi-
mistyyliin ja opiskelijoiden motivaatiota voidaan parantaa oikea-aikaisella palaut-
teella. Opettajille ja opetuslaitoksen hallinnolle voidaan tarjota tietoa opetuksen ja
opintosuunnitelman vaikuttavuudesta. Datatieteen avulla voidaan myös parantaa pää-
töksentekoa ja vähentää kuluja. (Siemens et al., 2007)
28
Pelimaailmassa datatiedettä on sovellettu markkinointiin ja pelisuunnitteluun. Mark-
kinoinnissa sitä käytetään kuten muillakin aloilla, eli tunnistetaan asiakassegmenttejä
ja kohdennetaan markkinointia niiden perustella. Pelisuunnittelussa pystytään taas
mittaamaan, miten pelaajat reagoivat eri ärsykkeisiin ja saadun palautteen perusteella
voidaan muokata peliä toivottuun suuntaan. Tässä tärkein tavoite on maksimoida pe-
liaika ja kokemus siitä, että rahalle on saatu vastinetta maksullisten pelien suhteen ja
toisaalta ilmaisissa, mainosrahoitteisissa peleissä on tarkoitus maksimoida nähtyjen
mainosten määrä. (Marr, 2015) Lisäksi ”freemium”-mallin mukaan hinnoitelluissa pe-
leissä maksua ei suoriteta peliä ostettaessa vaan sitä käytettäessä ja datatieteen avulla
optimoidaan pelin sisällä käytetty raha. Kilpailullisissa peleissä datatieteellä varmiste-
taan pelihahmojen välinen tasapaino. Myös kasinojen pelikoneissa voittojen ajankohta
on rytmitetty pelaajan mentaliteetin mukaan, oli sitten kyseessä harkitsevainen varmo-
jen voittojen pelaaja tai riskialtis vedonlyöjä. (Parkin, 2015)
3.4 Datatiede prosessina
Tässä luvussa käydään läpi datatieteen prosessi. Datatieteen soveltaminen ei ole trivi-
aali seikka vaan vaatii verkko-opetuksessakin erityistä suunnittelua. Jokainen vaihe
nojaa edelliseen ja perustan on oltava kunnossa, jos prosessin kautta halutaan saavuttaa
hyötyjä. Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta ja
sen puhdistamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havain-
nollistamisesta ja päätöksenteosta ja se on avattu kuvassa 5.
29
Kuva 5: Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta, tiedon puh-
distamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havainnollistamisesta.
(Schutt & O'Neil, 2013)
3.4.1 Kysymyksen asettelu
Datatieteen prosessi alkaa kysymyksen asettelulla – mihin kysymykseen halutaan vas-
tata tai mikä ongelma halutaan ratkaista. Kysymys voi esimerkiksi olla: Minkälaiset
ominaisuudet kuvaavat hyvin suoriutuvia opiskelijoita? (Bucky, 2016). Tässä ensim-
mäisessä vaiheessa syntyy datatieteen varsinainen arvo, joten on tärkeää, että haetaan
vastausta oikeaan kysymykseen. Oikea kysymys on se, johon vastattaessa saavutetaan
olosuhteisiin nähden suurin mahdollinen hyöty. Hyödyn ei tarvitse välttämättä olla
korkein rahallinen hyöty, vaan se voi olla myös esimerkiksi kilpailuetu. (Shung, 2014)
Kysymykset kumpuavat omasta toimialastaan, joka on tunnettava, jotta kysymys osa-
taan kysyä oikein. Näin ollen tämä on tärkeä työvaihe datan analysoimisessa. (Stanton,
2013)
30
3.4.2 Tiedon hankinta
Ennen kuin tietoa voi analysoida, se täytyy kerätä ja tallentaa. Tiedonlähteitä on monia
erilaisia, kuten esim. julkiset tilastot, verkkorajapintojen kautta saatava tieto, sensori-
data, tietokoneohjelmiston generoima tieto. Esimerkiksi terveydenhuollon tietokanto-
jen potilaskohtaista dataa voidaan täydentää potilaan omien aktiviteetin- ja terveyden-
seurantalaitteiden datalla. Eri lähteistä kerätty data täytyy koostaa yhdeksi käsiteltä-
väksi datajoukoksi. (Guo, 2013; Stanton, 2013)
Alakohtainen asiantuntijuus auttaa valitsemaan mitä tietoa kerätään. Yleensä kannat-
taa kerätä kaikki mahdollinen tutkimuskysymykseen liittyvä data, jotta saadaan mah-
dollisimman tarkkoja tuloksia, mutta joskus kannattaa välttää keräämästä joitain tie-
toja esim. yksityisyydensuojan nojalla. (Ali, 2016; Altintas & Gupta, 2016; Gutierrez,
2014) Keräämisessä voidaan käyttää hyödyksi keskeisiä suorituskykymittareita (eng.
Key Performance Indicator, KPI), jotka kertovat olennaisen tiedon esimerkiksi yrityk-
sen suorituskyvystä. (Marr, 2016e)
3.4.3 Tiedon puhdistaminen
Kerätty tieto täytyy puhdistaa, jotta sitä voidaan analysoida ja se vaatii tiedon eri as-
teista muokkausta riippuen sen lähteestä. Esimerkiksi verkkosivuilta kopioitu tieto
voidaan joutua jäsentämään lähdekielen sääntöjen mukaan ennen kuin sitä voidaan
käyttää. Tyhjät ja puuttuvat arvot sekä duplikaatit tulee käsitellä tilanteen vaatimalla
tavalla, tiedon muoto tulee yhtenäistää ja semanttiset virheet korjata. Tiedon puhdista-
minen voi tapahtua koneellisesti tai manuaalisen työn avulla. (Bandyopadhyay, 2016;
Guo, 2013; Loukides, 2010)
Kun tieto on jäsennetty, sen laatu täytyy ottaa tarkasteluun. Yleensä tieto on puutteel-
lista tai sisäisesti ristiriitaista. Ristiriitojen syy täytyy selvittää. Onko tieto virheellistä
ja jos on, mistä se johtuu? Kertooko ristiriita jotain muuta kuin mitä tutkimuskysymys
kysyy ja seurataanko sen sijaan tätä ristiriitaisuuksien kysymyslinjaa? Esimerkiksi ot-
sonikato olisi todettu aikaisemmin, mutta aukon todentaminen viivästyi, koska auto-
maattinen tiedonkeräys hylkäsi liian matalat lukemat. (Loukides, 2010)
31
Tiedon puhdistaminen on yleensä aikaa vievin ja pitkästyttävin työvaihe datatieteessä
- datatietelijän työajasta jopa 50% - 80% voi mennä tietoa puhdistettaessa. Etenkin eri
tietolähteistä kerättyä tietoa yhdistettäessä sen puhdistaminen käy entistä vaikeam-
maksi. Sitä puhdistettaessa voidaan kuitenkin päätellä jotain tietojoukon ominaispiir-
teistä, mitä oletuksia siitä voidaan tehdä ja millä tavalla sitä kannattaa lähteä analysoi-
maan. (Guo, 2013; Lohr, 2014)
3.4.4 Kuvaileva analytiikka
Kuva 6: Gartnerin analyyttinen jatkumo kuvailevasta analytiikasta ohjailevaan analytiikkaan.
(Laney, 2015)
Kuvassa 6 Gartner asettaa kuvailevan analytiikan (eng. descriptive analytics) analyyt-
tisen jatkumon alimmalle tasolle. Se katsoo taaksepäin ja on helpoin analytiikan ala
suorittaa. Se vastaa kysymykseen: Mitä on tapahtunut? (Laney, 2015)
Kuvailevan analytiikan keinoin yritetään ymmärtää datasta mitä tapahtui menneisyy-
dessä. Tässä yhteydessä menneisyys tarkoittaa aikaa minuuteista vuosiin. Tämä on
yleisin ja yksinkertaisin tapa analysoida dataa ja se auttaa ymmärtämään mitä on tehty,
32
mitä siitä voi oppia ja miten se saattaa vaikuttaa tulevaisuuteen. Tärkeimpänä kuvai-
levan analytiikan välineenä ovat yksinkertaiset tilastotieteelliset menetelmät, kuten
summa, keskiarvo ja prosenttimääräiset muutokset. (Bertolucci, 2013)
Kuvailevaa analytiikkaa hyödynnetään näyttämään tietoa, kuten varastosaldo, asiak-
kaiden keskimääräinen ostosmäärä ja myynnin vuotuinen muutos. Yleisin kuvailevan
analytiikan tulos onkin raportti, jossa kerrotaan miten esimerkiksi yrityksen tuotto, ra-
hoitus, myynti yms. ovat kehittyneet. Kuvailevaa analytiikkaa käytetään myös esimer-
kiksi luokittelemaan analysoinnin kohteita (esim. asiakkaita) eri ominaisuuksien (ku-
ten suositun tuotteen) mukaan. (Bertolucci, 2013)
3.4.5 Ennustava analytiikka
Kuvassa 6 Gartner asettaa ennustavan analytiikan (eng. predictive analytics) analyyt-
tisen jatkumon toiseksi korkeimmalle tasolle. Se katsoo eteenpäin ajassa ja on toiseksi
vaikein analytiikan ala suorittaa. Se vastaa kysymykseen: Mitä tulee tapahtumaan?
(Laney, 2015)
Ennustavan analytiikan keinoin pyritään ennustamaan tulevia tapahtumia menneisyy-
den pohjalta. Sen tarkoitus on tuottaa dataa tulevaisuudesta, jonka pohjalta voidaan
tehdä toimenpiteitä muun muassa antamalla mahdollisille tapahtumille todennäköi-
syyksiä. Pitää kuitenkin muistaa, että mikään algoritmi ei voi ennustaa tulevaisuutta
100% todennäköisyydellä. (Halo Business Intelligence, 2016)
Ennustavassa analytiikassa käytetään monenlaisia menetelmiä mallintamisen, koneop-
pimisen, datalouhinnan ja peliteorian alalta, joilla pyritään havaitsemaan datasta eri-
laisia toistuvia malleja ja datajoukkojen välisiä suhteita, joita käytetään ennustamaan
esimerkiksi asiakaskäyttäytymistä, ostostrendejä ja tuotantoketjun vaatimuksia. Eräs
yleinen sovelluskohde on luottoluokituksen laskeminen, joiden avulla luoton antaja
voi arvioida luoton saajan tulevaisuuden maksukykyä. (Halo Business Intelligence,
2016; M. Walker, 2012b)
Ennustavan analytiikka ei ole rajoittunut vain ajalliseen ennustamiseen – olemassa ole-
vaa tietoa voidaan myös käyttää sellaisen tiedon ennustamiseen, jota ei vielä tiedä.
33
Esimerkiksi sosiaalisessa mediassa ennustavaa analytiikkaa voidaan käyttää henkilön
vaikutuksen ennustamiseen hänen sosiaalisen aktiivisuustiedon perusteella. Sitä käy-
tetään myös tunneanalyysiin, jossa analysoidaan henkilön tuottamaa tekstitietoa ja en-
nustetaan siitä henkilön tunnetilaa. (Wu, 2013a)
3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen
Kuva 7: BADIR™-päätöksentekoprosessi (Jain, 2013)
Kerättyä tietoa voidaan analysoida ja ymmärtää, mutta siitä ei ole hyötyä, jos sitä ei
käytetä päätöksenteon tukena! Päätöksentekoa helpotetaan pitämällä se mukana pro-
sessin jokaisessa vaiheessa esimerkiksi pysymällä liiketoiminnallisten rajoitteiden si-
sällä, osallistamalla avainsidosryhmiä ja ajoittamalla päätöksenteon niin, että sidos-
ryhmät ovat valmiita ryhtymään toimeen analyysin tulosten pohjalta. Kuvassa 7 on
havainnollistettu päätöksentekoprosessia, jossa data ja siitä tehdyt johtopäätökset ovat
kiinteä ja jatkuva osa koko prosessia. (Jain, 2013)
Päätöksiä tehtäessä pitää myös muistaa datan konteksti ja arvioida tulosten oikeelli-
suus. Jos jotain datajoukkoa analysoidaan liian pitkälle, siitä vedettyjä johtopäätöksiä
ei voi yleistää datajoukon ulkopuoliseen maailmaan. Tätä ilmiötä kutsutaan ylisovit-
tamiseksi. (Provost & Fawcett, 2013)
34
Tuloksista ei ole hyötyä, jos niitä ei ymmärretä, joten ne täytyy esittää ymmärrettä-
vässä muodossa kohdeyleisölle, jotka eivät yleensä ole asiantuntijoita. Näin ollen on
erittäin tärkeää, että datatieteilijät ja päätöksentekijät puhuvat asioista kaikkien osa-
puolien ymmärtämillä termeillä. Esimerkiksi teknisien mittareiden (algoritmien tark-
kuus tai herkkyys) sijaan tulisi puhua kontekstin mukaisin termein, eli yritysmaail-
massa liiketoimintamittarien mukaan. Mittaustulosten sijaan kannattaa puhua analy-
soinnin pohjalta tehtyjen toimenpide-ehdotuksien hyvistä ja huonoista puolista. Tari-
nankerronta on tehokas tapa kommunikoida tulokset. (Davenport, 2013; Matsudaira,
2015)
Tiedon havainnollistaminen eli visualisointi on tehokas tapa havainnollistaa analyysin
tuloksia. Taulukossa 1 on esimerkki pylväskaaviosta. Eri kaaviotyylejä, kuten pylväs-
, viiva- ja ympyräkaavioita, voi soveltaa tapauskohtaisesti ja jotkut ohjelmistot, kuten
SAS Visual Analytics, osaavat valita kaaviotyylin automaattisesti käytetyn datan mu-
kaan. Kaaviot voivat myös olla dynaamisia ja vuorovaikutteisia, joiden avulla voidaan
helpommin tuoda esille ajan mittaan tapahtuvia muutoksia ja porautua tarkemmin eri
mittaustuloksiin. Tietoa voidaan myös havainnollistaa muilla keinoin, kuten esim. 3D-
tulostetuilla, kosketeltavilla tulosten esityksillä. (Davenport, 2013)
35
Taulukko 1: Esimerkki pylväskaaviosta
Eri medioita voidaan myös yhdistää tulosten kommunikointia varten. Esimerkiksi mu-
siikkivideot yhdistävät kuvaa, ääntä ja videota tulosten kommunikointia varten ja sitä
voidaan vielä tukea suusanallisella esityksellä. Myös pelejä voidaan käyttää helpotta-
maan eri muuttujien välisten monimutkaisten vuorovaikutusten ymmärtämistä.
(Davenport, 2013)
3.5 Datatieteen kehityssuuntia
Tässä luvussa luodaan katsaus datatieteen tulevaisuuteen ja mitä siitä voidaan yrittää
sanoa.
Luonnollisen kielen käsittely (Natural Language Processing, NLP) helpottaa koneen
ja ihmisen välisen kommunikointia ja alentaa monimutkaisen tiedon analysoinnin kyn-
nystä. Tämä tulee mahdollistamaan tiedon analysoinnin yhä suuremmalle käyttäjäjou-
kolle, joilla ei välttämättä muuten olisi asiantuntijuutta sitä suorittaa. Ei tarvittaisi enää
0
1
2
3
4
5
6
Luokka 1 Luokka 2 Luokka 3 Luokka 4
Esimerkki pylväskaaviosta
Sarja 1 Sarja 2 Sarja 3
36
tietojenkäsittelytieteen opintoja vaan lyhyt tutustuminen NLP-teknologian käyttöön
riittäisi tuottamaan hyötyä tiedon analysoinnista. Myös tiedon havainnollistaminen au-
tomatisoituu uusien tuotteiden ilmestyessä. Esimerkiksi tietokoneohjelma Quill pystyy
tuottamaan tekstimuotoisia raportteja, jotka selittävät analysoinnin tulokset ja tuotta-
vat niistä tiivistelmän automaattisesti. (Marr, 2016b)
Preskriptiivinen eli ohjaileva analytiikka lisääntyy tulevaisuudessa. Siinä missä ennus-
tava analytiikka ennustaa useita mahdollisia kehityssuuntia, ohjailevalla analytiikalla
voidaan ennustaa eri toimenpiteiden vaikutuksia, joka mahdollistaa parhaiden toimen-
piteiden suosittelemisen. (Wu, 2013b) Sen avulla voi myös tuottaa ehdotuksia tulevien
mahdollisuuksien hyödyntämiseen tai vähentää tulevia riskejä. Ohjaava analytiikka
voi jatkuvasti ja automaattisesti käsitellä uutta tietoa parantaen ennustamisen tark-
kuutta ja tuottaen parempia toimenpide-ehdotuksia. (M. Walker, 2012b)
Kuvassa 6 Gartner asettaa preskriptiivisen eli ohjailevan analytiikan (eng. prescriptive
analytics) analyyttisen jatkumon korkeimmalle tasolle. Se katsoo eteenpäin ajassa ja
on vaikein analytiikan ala suorittaa. Se vastaa kysymykseen: Kuinka saadaan aikaan
haluttu tulos? (Laney, 2015)
Tiedon visualisointi tulee hyötymään käynnissä olevasta virtuaalitodellisuuden yleis-
tymisestä. Kun tiedon määrä ja monimutkaisuus lisääntyvät, tiedon kaksiulotteinen
esittäminen ei riitä välittämään lisääntynyttä tietosisältöä. Virtuaalitodellisuuden
avulla tiedon havainnollistamiseen voidaan lisätä 360-asteen näkökenttä ja kolmas
ulottuvuus. Sen avulla mahdollistetaan hienojakoisempi visualisaatio ja parempi im-
mersio eli ”uppoaminen” mediaan. (Marr, 2016d)
37
4 Datatiede verkko-opetuksessa
Edellisissä luvuissa käytiin läpi verkko-opetuksen ja datatieteen taustoja sekä merki-
tystä. Tässä luvussa vedetään edellä esitelty tieto yhteen ja tarkastellaan, mitä datatiede
voi merkitä verkko-opetuksessa. Luvussa 4.1 esitellään kahden alan tutkimusyhteisön,
EDM ja LAK, määritelmät. Sen jälkeen motivoidaan lukijaa kertomalla mahdollisista
hyödyistä luvussa 4.2. Datatieteen käytännön suorittamista esitellään luvussa 4.3 ja
luku 4.4 vastaa kysymykseen: mitä datatieteellä voi verkko-opetuksessa tehdä. Lu-
vussa 4.5 esitellään muutama merkittävä tapaustutkimus ja luvussa 4.6 muutama mer-
kille pantava kaupallinen tuote. Viimeiseksi luvussa 4.7 luodaan katsaus tulevaan.
4.1 EDM ja LAK
Kiinnostus dataa ja sen analysointia kohtaan koulutuksessa, opetuksessa ja oppimi-
sessa on johtanut kahden eri tutkimusyhteisön syntymiseen – koulutusdatanlouhinta
(eng. Educational Data Mining, EDM) ja oppimisen analytiikka (eng. Learning Ana-
lytics and Knowledge, LAK) (Siemens & Baker, 2012b) Taulukossa 2 on avattu niiden
välisiä eroja. Ne molemmat edustavat datapohjaista lähestymistapaa koulutukseen ja
ne molemmat tähtäävät koulutuksen parantamiseen parantamalla arviointia, koulutus-
kysymysten ymmärrystä ja kuinka väliintulot suunnitellaan ja valitaan. Niillä on kui-
tenkin muutama keskeinen eroavaisuus. EDM analysoi tietoa mieluummin automaat-
tisesti, kun taas LAK painottaa ihmisen arvostelukykyä automatiikan sijaan. EDM
hyödyntää ennemmin automaattista puuttumista opiskeluun, kun LAK tuottaa analy-
soitua tietoa opettajien ja opiskelijoiden käyttöön. EDM keskittyy enemmän ilmiöiden
redusoimiseen komponenteiksi ja tarkastelee niiden välisiä vuorovaikutuksia. LAK
vastaavasti lähestyy järjestelmää holistisesti, käsitellen sitä kokonaisuutena.
38
LAK EDM
Löydökset Ihmisen harkintakyky
tärkeintä: Automaattinen
analysointi on työkalu
tätä varten.
Automaattinen analy-
sointi tärkeintä; Ihmisen
harkintakyky on työkalu
tätä varten.
Reduktio vs holismi Painottaa monimutkais-
tenkin kokonaisuuksien
ymmärtämistä
Painottaa selittävien
muuttujien vähentämistä
(redusointia) ja niiden
välisten suhteiden analy-
sointia
Tausta LAK-tutkijoiden tausta
semanttisessa verkossa,
tulosten ennustamisessa
ja systeemisissä interven-
tioissa.
EDM-tutkijoiden tausta
koulutusohjelmistossa ja
opiskelijoiden mallinta-
misessa sekä koulutus-
suoritusten ennustami-
sessa.
Mukautuminen ja per-
sonalisaatio
Keskittyy tiedottamiseen
ja päätösvallan antami-
seen opettajalle ja opis-
kelijalle.
Keskittyy automaattisen
mukautumiseen
Tekniikat ja menetel-
mät
Sosiaalisten verkkojen,
tunnetilojen, vaikutusval-
lan ja keskustelujen ana-
lysointi; opiskelijoiden
suoritusten ennustaminen
Luokittelu, klusterointi,
Bayesiläinen mallinnus,
vuorovaikutussuhteiden
analysointi, mallianalyysi
(discovery with models),
visualisaatio
Taulukko 2: EDM:n ja LAK:n erot (Siemens & Baker, 2012b)
39
4.2 Sovellusalat
Datatiedettä sovelletaan opiskelussa kahdeksaan eri osa-alueeseen, jotka ovat opiske-
lijan tietämyksen, käyttäytymisen ja kokemuksen mallintaminen; opiskelijan profiloi-
minen; toimialueen mallintaminen; oppimisaihioiden ja pedagogisen mallin analyysi;
trendianalyysi sekä käyttäjäkokemuksen mukauttaminen ja yksilöllistäminen.
(Bienkowski et al., 2012)
Tietolähteinä oppimisen analytiikalle toimivat etenkin etäopiskelussa ja MOOC-kurs-
seilla verkko-oppimisympäristöt, joissa opiskelijat tarkastelevat aikataulujaan sekä ar-
vosanojaan, lukevat oppimateriaalia, osallistuvat keskustelufoorumeille ja lähettävät
tehtäviä arvioitaviksi. Verkko-oppimisympäristöistä kerättyä tietoa voidaan yhdistää
opiskelijatietojärjestelmiin (SIS), jotka voivat sisältää tietoa esim. aikaisemmista tut-
kinnoista, sosioekonomisesta ja etnisestä taustasta, kurssivalinnoista ja arvosanoista.
Tietolähteenä voidaan käyttää myös sensoridataa esimerkiksi kulunvalvonnasta, josta
nähdään opiskelijan liikkuminen koulutuslaitoksessa, ja langattoman verkon käyttö-
tiedoista. Kirjaston tietojärjestelmistä voidaan kerätä tietoa kirjastokäynneistä, lai-
nauksista ja sähköisten julkaisujen lukemisesta. Tietoa voidaan myös kerätä sähköi-
sistä oppikirjoista, älykkäistä opetusjärjestelmistä (eng. Intelligent Tutoring System,
ITS), videoista, opetuspeleistä sekä opiskelijoiden itse tuottamasta tiedosta. (Sclater et
al., 2016)
4.2.1 Opiskelijan tietämyksen mallintaminen
Opiskelijan tietämyksen taso voidaan päätellä mittareista kuten kysymysten vastaukset
(esim. oikein, osittain oikein, väärin), kulunut aika ennen vastausta sekä pyydettyjen
vastausvihjeiden toistuvien väärien vastauksien ja tehtyjen virheiden määrä ja laatu.
Päätelmät voidaan tehdä ennustavan analytiikan keinoin tietokonemallia hyväksikäyt-
tämällä tai tarkastelemalla suoritusdataa esimerkiksi dashboard-näkymästä.
(Bienkowski et al., 2012)
40
Opiskelijan tietämystä mallintamalla voidaan opetusta yksilöllistää vastaamaan hänen
tietotasoaan. Sen avulla voidaan muodostaa muun muassa suosituksia ja älykkäitä ope-
tusjärjestelmiä, joissa sitä käytetään päättämään mitä kysymyksiä seuraavaksi opiske-
lijalle annetaan. Esimerkiksi koneoppimista hyödyntäen voidaan arvioida vastauksista
tietämystason lisäksi, yrittääkö opiskelija arvata oikeita vastauksia tai antoiko hän
erehdyksessä väärän vastauksen. (R. S. J. D. Baker, Corbett, & Aleven, 2008;
Bienkowski et al., 2012)
Tietämysmallien hyödyntäminen on yleinen ominaisuus kaupallisissa LMS-tuotteissa
ja niiden käyttö vaihtelee automatiikan ja manuaalisen työn välillä. Jotkut järjestelmät
siirtävät opiskelijat eteenpäin opinnoissaan automaattisesti päätellyn tietämystason
mukaan. Täysin koneellisesti tehty päätös etenemisestä tai lisäopinnoista voi olla kui-
tenkin riskialtista, koska ”vielä ei tiedetä tarpeeksi aiheiden välisistä riippuvuuksista,
jotta voitaisiin tehdä näitä päätöksiä automaattisesti.” (Bienkowski et al., 2012). Jotkut
järjestelmät puolestaan antavat vain tietoa ja suosituksia opettajalle, kun taas osassa
järjestelmistä etenemis- tai lisäopiskelusuositukset annetaan opiskelijalle.
4.2.2 Käyttäytymisen mallintaminen
Käyttäytymisen mallintamisessa käytetään samankaltaisia mittareita kuin tietämyk-
senkin mallintamisessa ja lisäksi mittareita kuten esimerkiksi opiskelijan verkko-op-
pimisympäristössä vietetty aika, kurssin suoritustulokset, läsnäolo, myöhässä olo ja
jopa aikaisemmin mallinnettu tietämystaso. Näistä mittareista voidaan päätellä millä
tavalla opiskelijan toiminta verkko-oppimisympäristössä vaikutta opiskelutuloksiin.
Mallintamalla opiskelijan käyttäytymistä voidaan havaita esimerkiksi järjestelmän
manipulointia ja sen heikentävää vaikutusta tuloksiin. Käyttäytymiseen reagoimalla
esimerkiksi lisätehtävillä voidaan vähentää ei-toivotun käyttäytymisen negatiivisa vai-
kutuksia. (R. S. Baker, Corbett, Koedinger, & Wagner, 2004; Bienkowski et al., 2012)
Käyttäytymistä voidaan mallintaa analysoimalla verkko-oppimisympäristön lokitie-
toja ja niistä voidaan päätellä oppimista korreloivia muuttujia. Eräässä tutkimuksessa
41
lokitiedoista löydettiin neljä muuttujaa, jotka selittivät 30% opiskelijoiden arvosano-
jen vaihtelevuudesta ja niiden perusteella voitiin ennustaa oikein 81% hylätyn suori-
tuksen saaneista. (Macfadyen & Dawson, 2010)
4.2.3 Kokemuksen mallintaminen
Opiskelukokemuksen mallintamisella tarkoitetaan opiskelijan tyytyväisyyttä opiske-
lukokemukseen. Se voidaan määrittää kyselyjen lisäksi mittaamalla opiskelijoiden va-
lintoja, käyttäytymistä, suoritustasoa ja halukkuutta jatkaa opiskelua. Opiskelukoke-
mus on tärkeää etenkin yrityksille, jotka tuottavat kaupallisia verkkokursseja. Sitä mi-
tataan etenkin opiskelijapysyvyydellä. Kokemus täytyy kuitenkin päätellä monien mit-
tareiden perusteella. Kyselyissä opiskelijat voivat kertoa pitävänsä kurssista, mutta
sillä voi silti olla suurempi keskeytysaste, kuin toisella kurssilla, josta opiskelijat ker-
toivat pitävänsä vähemmän. (Bienkowski et al., 2012)
4.2.4 Opiskelijan profilointi
Opiskelijan profiloinnilla pyritään muodostamaan profiili, joka kuvaa hänen olennai-
set erityispiirteensä. Profiloinnin tarkoituksena on parantaa oppimisen tehokkuutta ja
vaikuttavuutta yksilöllistämällä ja mukauttamalla verkko-oppimisympäristöä opiske-
lijan tai opiskelijaryhmän mukaan. Profilointia suoritetaan usein luokittelemalla opis-
kelijoita heidän opiskeludatan (kuten aikaisemmin kuvailtu) tai demografisen datan,
tai molempien, perusteella. (Bienkowski et al., 2012)
4.2.5 Aihealueen mallintaminen
Aihealuemallia käytetään edustamaan jonkin aihealueen, kuten matematiikan tai tai-
dehistorian, avainkäsitteitä ja niiden välisiä suhteita. Sen avulla pyritään tunnistamaan,
miten avainkäsitteiden jaottelu vaikuttaa oppimiseen eli esimerkiksi, miten jokin aihe-
alue tuodaan opiskeltavaksi, minkälaisina palasina ja missä järjestyksessä. Mittareina
käytetään opiskeludataa (kuten aikaisemmin kuvailtu), aihealueen taksonomiaa eli
luokittelua ja ongelmien välisiä sekä ongelmien ja vastauksien välisiä yhteyksiä.
(Bienkowski et al., 2012)
42
4.2.6 Oppimisaihioiden ja pedagogisen mallin analysointi
Oppimisaihioiden ja pedagogisen mallin analysoinnilla pyritään selvittämään vastauk-
sia kysymyksiin, kuten mitkä oppimisaihiot edesauttavat oppimista tehokkaimmin,
mahdollistaako jokin opetussuunnitelma paremman oppimisen kuin toinen ja minkä
tyyppinen koulutuksen järjestäminen on tehokkain tapa edistää oppimista. Oppimisai-
hioiden ja pedagogisen mallin analysoinnilla voidaan parantaa verkko-oppimisympä-
ristöjä ja sillä on merkittävä vaikutus opiskelijoiden oppimiseen ja se on keskeinen
mielenkiinnon kohde oppimisen analytiikan ja koulutustiedonlouhinnan tutkimisessa.
Mittareina käytetään opiskelijoiden vastauksia, opiskelijoiden ajan myötä tapahtuvaa
toimintaa oppimisaihioiden suhteen, milloin ja mihin ryhmään pedagogista mallia käy-
tettiin, sekä opiskelijoiden suoritustasoa ennen ja jälkeen kokeen suorituksen.
(Bienkowski et al., 2012)
4.2.7 Trendianalyysi
Trendianalyysin avulla kerätystä datasta pyritään löytämään jonkin ilmiön kehityksen
suunta eli trendi. Sillä pyritään vastaamaan kysymyksiin kuten mitä muutoksia oppi-
misessa on ajan mittaan tapahtunut. Trendianalyysiä on hyödyllinen tarkastellessa esi-
merkiksi koesuorituksia ja muita mittareita, joiden avulla voidaan selvittää eri käytän-
töjen vaikutusta oppimiseen. Koulutusdatanlouhinnassa sillä tarkoitetaan eri hahmojen
löytämistä asiaan liittymättömän datan (nk. kohinan) seasta. Trendianalyysiä varten
kerättävä data vaihtelee halutun tiedon mukaan, mutta tyypillisesti tarvitaan dataa ai-
nakin kolmelta ajanjaksolta. (Bienkowski et al., 2012)
4.2.8 Mukautuminen ja yksilöllistäminen
Yksilöllistämisellä eli personoinnilla tarkoitetaan tässä yhteydessä mukautuvaa rytmi-
tystä sekä ohjeistuksen muokkaamista ja sisällön räätälöintiä oppimismieltymysten
mukaan. Mukautumisella tarkoitetaan muutoksia, jotka järjestelmä tai kouluttaja tekee
yksilöllistääkseen opetusta opiskelijoiden reaktioiden mukaan. Mukautumisella ja yk-
silöllistämisellä vastataan kysymyksiin, kuten kuinka oppimiskokemusta tulisi muut-
43
taa tätä opiskelijaa varten tai mitä muutoksia tarvitaan, että voidaan palvella opiskeli-
joita parhaalla mahdollisella tavalla reaaliaikaisesti. Usein mukauttamisessa käytetään
hyödyksi luokittelun ja trendianalyysin avulla kehitettyjä työkaluja, kuten opiskelijalle
suunnattua palautetta tai suosituksia seuraavasta toiminnosta. Mukauttamisen ja yksi-
löllistämisen mahdollistamiseksi jokaista opiskelijaa varten pyritään muodostamaan
profiili, jota varten kerätään sellaista dataa kuten sarjoja opiskelijan suorittamia toi-
mintasarjoja, tietoa opiskelijan yrittämistä vaiheista tai ongelmista sekä demografista
tietoa. (Bienkowski et al., 2012)
4.3 Hyödyt
Tässä luvussa käsitellään datatieteen verkko-opetukseen soveltamisesta syntyvää hyö-
tyä. Merkittävimmät hyödyt syntyvät opiskelun ja opetuksen laatuun, opiskelija-
pysyvyyteen sekä kustannustehokkuuteen.
4.3.1 Opiskelun laatu
Eräs oppimisen analytiikan tärkeimmistä sovellutuksista on antaa opiskelijalle tietoa
siitä, kuinka hän edistyy suhteessa omiin tavoitteisiinsa ja mitä hänen täytyy tehdä
saavuttaakseen ne. Jotkut yliopistot myös tarjoavat opiskelijoille analytiikkapohjaisia
järjestelmiä, jotka auttavat opiskelijoita valitsemaan tulevia opintoja. Ne pyrkivät tar-
joamaan optimaalisen opintopolun ottamalla huomioon opiskelijan omat uravalinnat,
kyvyt sekä aikaisempien opintojen arvosanat. (Sclater et al., 2016)
4.3.2 Opetuksen laatu
Oppimisen analytiikkaa käytetään opetuksen laadun parantamiseen. Sen avulla voi-
daan antaa opettajille palautetta opiskelumateriaalin ja -menetelmien sekä arviointi-
prosessin toimivuudesta, joka mahdollistaa opetuksen jatkuvan kehittämisen. Tieto
opiskelijan oppimiskokemuksesta mahdollistaa huolenaiheisiin puuttumisen ja voi
johtaa parempaan yhteyteen opiskelijan ja henkilökunnan välillä. Analytiikkaa voi-
daan käyttää seuraamaan opiskelijoiden suoritusta opintojakson aikana ja sen tiedon
44
pohjalta opettajat voivat muokata opetustaan esimerkiksi, jos opiskelijoilla on vai-
keuksia tietyn aiheen kanssa. Tämä tieto hyödyttää nykyisten opiskelijoiden lisäksi
myös tulevia opiskelijoita. (Sclater et al., 2016)
Oppimisen analytiikalla voidaan myös saavuttaa laajempia hyötyjä oppimiselle, ope-
tukselle ja opiskelijoiden tuelle. Sen avulla voidaan edesauttaa datapohjaista ajattelua
ja tietoon perustuvaa päätöksentekoa. Jopa pienimuotoinen opetusanalyyttinen kokeilu
voi johtaa parempaan käsitykseen datan hyödyntämisestä ja keskustelun käymiseen
esimerkiksi opiskelijapysyvyydestä. Analytiikalla voi siis olla hyödyllisiä vaikutuksia
yli projektin tavoitteiden ja voi olla osa opetuskulttuurin muutosta kohti tietopohjaista
ajattelua. (Sclater et al., 2016)
4.3.3 Opiskelijapysyvyyden parantaminen
Analysoimalla tietoa opiskelijoista ja heidän suorituksistaan yliopistot voivat vähentää
keskeyttävien opiskelijoiden määrää, joka puolestaan vaikuttaa positiivisesti kyseessä
olevien opiskelijoiden elämään sekä alentaa yliopiston keskeyttäneisiin hukkaan hei-
tettyjä resursseja. Keskeyttämiseen johtavat ongelmat pystytään tunnistamaan entistä
aikaisemmin. Esimerkiksi Purduen yliopistossa ongelmat tunnistettiin jo lukukauden
toisella viikolla, joka on niin aikaisin, että se ei aikaisemmin ole ollut mahdollista.
Opiskelutietojen analyysiä voidaan käyttää ennustamaan ketkä opiskelijat eivät edisty
opinnoissaan. Esimerkiksi New Yorkin teknologisessa instituutissa pystytään ennus-
tamaan kolme neljästä keskeyttäneestä. (Sclater et al., 2016)
Kun keskeyttämisriskin alttiina olevat opiskelijat on tunnistettu, heihin voidaan koh-
dentaa yksilöllistettyjä tukitoimia ja sitä kautta pyrkiä säilyttämään heidät opiskeli-
joina. Eräs esimerkki tästä on opiskelijan dashboard, josta hän näkee edistymisensä
suhteessa tavoitteisiinsa tai muihin opiskelijoihin. Tämä on huomattu motivoivan opis-
kelijoita joissain tapauksissa. Purduen yliopistossa käytettävä Signals-järjestelmä vä-
hensi D ja F -arvosanoja 14% (asteikolla A-F, jossa A on paras). (Sclater et al., 2016)
45
4.3.4 Kustannustehokkuus
Oppimisen analytiikalla voidaan parantaa opiskelijapysyvyyttä, suoritus- sekä valmis-
tumistasoa, joka johtaa alempiin institutionaalisiin kustannuksiin per valmistuva opis-
kelija. Opintojen keskeyttäminen paitsi aiheuttaa negatiivisia vaikutuksia keskeyttä-
ville opiskelijoille ja kuluttaa turhaan koulutuslaitoksen varoja, myös säästää yhteis-
kunnan varoja, koska valmistuvat opiskelijat maksavat todennäköisemmin opintolai-
nansa takaisin. (Contact North, 2013; Sclater et al., 2016)
4.4 Käytäntö
Entä kuinka datatieteen soveltaminen verkko-opetukseen käytännössä tapahtuu? Sii-
hen pyritään tässä luvussa. Ensin käsitellään datatieteen menetelmiä, joista on verkko-
opetuksessa hyötyä. Seuraavaksi käsitellään hieman infrastruktuuria ja tarvittavia työ-
kaluja ja lopuksi esitellään joitain rajoitteita käytännön hyödyntämisessä.
4.4.1 Menetelmät
Tässä luvussa käsitellään mitä datatieteen menetelmiä verkko-opetukseen voidaan so-
veltaa. Niistä esitellään kolme ennustamisen menetelmää, neljä hahmontunnistuksen
ja yhteyksien louhinnan menetelmää sekä tiedonkeruun ja mallianalyysin menetelmät.
Ennustaminen
Yksi koulutusdatanlouhinnan merkittävimmistä menetelmistä on ennustaminen. Sen
tavoitteena on muodostaa malli, jonka avulla voidaan päätellä yksi muuttuja (ennus-
tettava muuttuja) jostakin datajoukon muiden muuttujien (ennustava muuttuja) yhdis-
telmästä. Ennustava malli luodaan ensin pienelle datajoukolle, jonka jälkeen sen luo-
tettavuus tarkistetaan tilastollisesti, jonka jälkeen se voidaan ottaa käyttöön suurem-
man datajoukon kanssa. Ennustavia malleja käytetään yleisesti ennustamaan tulevia
tapahtumia, kuten keskeyttäviä opiskelijoita, tai ennustamaan muuttujia, joita ei olisi
mahdollista mitata suoraan reaaliajassa. Esimerkiksi tunnereaktiotiedon kerääminen
46
vaatii perinteisesti häiritseviä kyselyitä tai kallista havainnointia, mutta opiskeluloki-
tiedoista muodostettu ennustava malli voi tuottaa saman datan häiritsemättä opiskelua.
(D’Mello, Craig, Witherspoon, McDaniel, & Graesser, 2008; Siemens & Baker,
2012a)
Oppimisen analytiikassa ja opiskeludatanlouhinnassa käytetään yleisesti kolmea eri
ennustusmenetelmää: luokittelijoita, regressioanalyysiä sekä piilevän tiedon arvioin-
tia (eng. latent knowledge estimation). Luokittelijoissa ennustettava muuttuja on bi-
näärinen (esim. 1 tai 0) tai kategorinen muuttuja. Koulutusalalla suosittuja luokittelu-
menetelmiä ovat mm. päätöspuut, satunnainen metsä (eng. random forest), päätössään-
nöt (eng. decision rules) sekä askel- ja logistinen regressio. Regressioanalyysissä en-
nustettava muuttuja on jatkuva muuttuja, esimerkiksi numero. Yleisin regressio-
analyysi koulutusdatanlouhinnassa on lineaarinen regressio. Piilevän tiedon arvioin-
tia käytetään tietämyksen mallintamiseen ja sen kaksi suosituinta algoritmia ovat
bayesilainen tiedonjäljitys (eng. Bayesian Knowledge Tracing, BKT) ja suoritusfakto-
rianalyysi (eng. Performance Factor Analysis, PFA). (Siemens & Baker, 2012a)
Hahmontunnistus
Hahmontunnistusalgoritmit eroavat ennustamisesta merkittävästi siinä, että niillä yri-
tetään löytää ennakolta tuntemattomia hahmoja datasta. Toisin kuin ennustamisessa,
hahmontunnistuksessa ei ole kiinnostuksen kohteena jotain tiettyä muuttujaa vaan da-
tasta pyritään etsimään luonnollisesti ilmaantuvaa rakennetta. Yleisimmät ennustus-
menetelmät EDM/LA:ssa ovat klusterointi, faktorianalyysi, sosiaalisten verkkojen
analysointi sekä aihealueen rakenteen analysointi (eng. domain structure analysis).
(Siemens & Baker, 2012a)
Klusteroinnissa pyritään jakamaan datajoukko samankaltaisuuden perusteella luon-
nollisesti ryhmittyviin joukkoihin eli klustereihin. Se on hyödyllinen menetelmä eten-
kin silloin, kun datajoukon todennäköisiä kategorioita ei tiedetä etukäteen. Klusteroin-
tia on käytetty opiskelijoiden ja opiskelijatoimintojen ryhmittelyyn, joiden avulla voi-
daan päätellä, kuinka opiskelijat käyttävät verkko-oppimisympäristöä ja sitä kautta pa-
47
rantaa opintosuunnitelmaa. Klusterointiin läheisesti liittyvässä faktorianalyysissä py-
ritään ryhmittelemään datajoukon muuttujat ja jaottelemaan ne joukoksi piileviä, eli
vain epäsuorasti tarkasteltavissa olevia, tekijöitä eli faktoreita. Toisin sanoen, faktori-
analyysissä pyritään ryhmittämään muuttujat niiden välisten korrelaatioiden avulla.
EDM/LA:ssa faktorianalyysiä käytetään vähentämään datajoukon ulottuvuuksia esi-
merkiksi vähentämällä muuttujien lukumäärää. Sitä on käytetty tunnistamaan minkä-
laisia suunnittelupäätöksiä älykkäiden opetusjärjestelmien suunnittelijat yleensä teke-
vät. Sosiaalisten verkkojen analysoinnissa (SNA) mallinnetaan yksittäisten toimi-
joiden välisiä suhteita ja vuorovaikutuksia sekä niistä ilmaantuvia hahmoja. Sitä voi-
daan käyttää esimerkiksi tehokkaiden ja tehottomien ryhmien erojen selvittämisessä
analysoimalla ryhmän sisäisten suhteiden vahvuutta. Sitä on myös käytetty opiskeli-
joiden kommunikaation ajan myötä tapahtuvien muutosten tutkimiseen sekä kuinka
opiskelijoiden sijainti sosiaalisessa verkostossa vaikuttaa heidän käsitykseen opiske-
luyhteisöön kuulumisesta. Näistä vuorovaikutuksen ja yhdistyneisyyden hahmoista
voidaan päätellä opiskelumenestymistä sekä sitoutuneisuutta kurssiin. Aihealueen ra-
kenteen analysoinnissa pyritään löytämään rakenne esimerkiksi yhdistämällä tietyn-
tyyppinen sisältö tietynlaisiin oppimisen komponentteihin tai taitoihin. Sitä tietoa voi-
daan sitten käyttää esimerkiksi piilevän tiedon arvioinnissa tai koulutusongelmien va-
linnassa. (Kotimaisten kielten keskus, 2016; Siemens & Baker, 2012a)
Yhteyksien louhinta
Yhteyksien louhinnassa pyritään löytämään yhteyksiä datajoukon eri muuttujien vä-
lillä. Se on ollut tutkituin EDM:n ala ja on vieläkin erittäin merkittävä. Esimerkkejä
yhteyksien louhinnasta ovat niiden muuttujien selvittäminen, jotka liittyvät vahvim-
min johonkin tiettyyn muuttujaan tai mitkä yhteydet kahden muuttujan välillä ovat
vahvimmat. Yleisesti ottaen yhteyksien louhinta koostuu neljästä eri menetelmästä:
assosiaatiosääntöjen louhinta, korrelaatioiden louhinta, toistuvien hahmojen louhinta
sekä syysuhteiden louhinta. (Siemens & Baker, 2012a)
Assosiaatiosääntöjen louhinnassa pyritään löytämään sellaisia sääntöjä, joilla löy-
dettyihin muuttujaryhmiin liittyy joidenkin muuttujien tietty arvo. Sitä voidaan käyttää
esimerkiksi yhdistämään opiskelijoiden toiminnat heidän saamaansa arvosanaan tai
48
löytämään yhdessä esiintyvät opiskeluvirheet. Korrelaatioiden louhinnassa pyritään
löytämään positiiviset tai negatiiviset suorat korrelaatiot muuttujien välillä. Sitä on
käytetty esimerkiksi laskemaan korrelaatiot erilaisten älykkäiden opetusjärjestelmien
tehtävien suunnitteluun käytettyjen ominaisuusjoukkojen ja opiskelijoiden suoritta-
man järjestelmän manipulaation esiintymisen välillä. Toistuvien hahmojen louhin-
nassa pyritään ajallisia yhteyksiä tapahtumien välillä. Sitä voi käyttää esimerkiksi sel-
vittämään minkä tyyppinen opiskelijoiden yhteistyö johtaa menestyksekkääseen tule-
vaan ryhmäprojektiin. Syysuhteiden louhinnassa pyritään selvittämään, onko jokin
tapahtuma toisen tapahtuman syy, eli esimerkiksi mitkä tekijät johtavat opiskelijan
heikkoon suoriutumiseen. (Bienkowski et al., 2012; Siemens & Baker, 2012a)
Tiedonkeruu päätöksenteon tueksi
Tiedonkeruu päätöksenteon tueksi on LAssa yleinen menetelmä, jonka tarkoituksena
on keskittää ja havainnollistaa opiskelijoiden suorituksista kerättyä tietoa reaaliaikai-
sesti kouluttajille, jotta siitä voidaan käyttää osana pedagogista toimintaa. Esimerkiksi
opiskelijoiden kehityskaaren visualisointia voidaan käyttää tunnistamaan yhteisiä piir-
teitä menestyneiden ja menestymättömien opiskelijoiden joukoissa tai päättelemään,
tarpeeksi ajoissa toimenpiteitä varten, mitkä opiskelijat ovat vaarassa jäädä opetuk-
sesta jälkeen. Joitain käytettyjä havainnollistamiskeinoja ovat muun muassa lämpö-
kartta (eng. heatmap), oppimiskaari (eng. learning curve) ja oppimisdiagrammi (eng.
learnogram).
Mallianalyysi (discovery with models)
Mallianalyysissä (eng. discovery with models) käytetään yhden koulutusdatalouhin-
nan tuloksia toisessa datalouhinnassa. Yleensä siinä muodostetaan jokin malli, usein
ennustavien menetelmien avulla, jonka tuottamaa ennustetta käytetään toisen data-
louhintamenetelmän syötteenä. Ehkä yleisin tapa suorittaa mallianalyysiä on käyttää
ennustavaa mallia toisessa ennustavassa mallissa, jolloin ensimmäisen mallin ennus-
tettuja muuttujia käytetään toisen mallin ennustavina muuttujina. Näin mallit voivat
koostua toisista malleista jopa monitasoisesti. Esimerkiksi vahvat oppimisen ennuste-
49
mallit tavallisesti riippuvat opiskelijoiden metakognitiivisista malleista, jotka puoles-
taan riippuvat piilevän tiedon arvioinnista, joka puolestaan on riippuvainen aihealueen
rakenteen malleista. Toinen tapa suorittaa mallianalyysiä on käyttää ennustavaa mallia
yhteyksien louhinnassa, jolloin tarkastellaan suhteita ensimmäisen mallin ennusteiden
ja muiden muuttujien välillä. Sitä on käytetty esimerkiksi verkko-oppimisympäristön
manipulaation ennustemallin korreloimiseksi opiskelijoiden yksilöllisiin eroihin,
jonka avulla pyrittiin ymmärtämään, ketkä opiskelijat todennäköisimmin syyllistyisi-
vät järjestelmän manipulaatioon. (Siemens & Baker, 2012a)
4.4.2 Infrastruktuuri
Kuva 8: Oppimisen analytiikan infrastruktuuri (Sclater et al., 2016). Data liikkuu datalähteistä
datavaraston kautta analytiikkasuorittimeen, josta analysoitu data on hälytysjärjestelmän,
dashboardien ja eri ohjelmistosovelluksien käytössä.
50
Oppimisdatan analysoinnin tekninen infrastruktuuri ei ole vielä vakiintunut johtuen
asiaankuuluvan teknologian nuoruudesta ja markkinoilla olevien ratkaisujen moninai-
suudesta, joten ohessa esitellään yksinkertainen esimerkki. Kuvassa 8 on esitetty Jisc:n
ehdotelma mahdollisesta oppimisen analytiikan infrastruktuurista. (Sclater et al.,
2016)
Datalähteinä toimivat kyselyin kerätty data, opiskelijatietojärjestelmä, verkko-oppi-
misympäristö sekä kirjastojärjestelmä. Näistä lähteistä kerätty data syötetään datava-
rastoon, jota kutsutaan myös LRS:ksi (Learning Record Store). Varsinainen datan ana-
lysointi tapahtuu suorittimessa, joka noutaa ja tallentaa dataa datavarastosta. Suoritti-
meen liittyy hälytys- ja väliintulojärjestelmä ja niistä liikkuu analysoitua dataa henki-
lökunnalle erilaisiin dashboard-näkymiin sekä opiskelijoiden ohjelmistosovelluksiin.
Opiskelijasovelluksessa opiskelijan on mahdollista tarkastella omaa sitoutumistaan ja
saavutuksiaan, jonka avulla hän voi asettaa itselleen opiskelutavoitteita ja saada niistä
vahvistavaa palautetta. Sovellukseen liittyy myös opiskelija suostumuspalvelu, jonka
avulla välitetään prosessorille tietoa datan keräys- ja käyttöoikeuksista. (Sclater et al.,
2016)
4.4.3 Työkalut
Pääosa EDM/LA-tutkimuksesta suoritetaan julkisesti saatavilla, usein avoimen lähde-
koodin työkaluilla, kuten R:llä, Weka:lla ja RapidMiner:lla. Näiden työkalujen avulla
voidaan toteuttaa EDM/LA:n menetelmiä ja ne myös tukevat tiedon valmistelua me-
netelmien soveltamista varten, mallien soveltuvuuden validointia sekä tiedon havain-
nollistamista. (Siemens & Baker, 2012a)
Avoimeen lähdekoodiin perustuvat työkalut mahdollistavat niiden toiminnallisuuden
laajentamisen tutkijoiden kehittämillä lisäosilla. R on avoimen lähdekoodin tilastolli-
sen laskennan ympäristö ja se on hyvin suosittu työkalu tilastollisen analyysin suorit-
tamiseen. Yksi sen vahvuuksista on julkaisukelpoisten kuvaajien tuottamisen help-
pous. Erityisen arvokas ominaisuus tutkijoille on mahdollisuus laajentaa R:n toimin-
nallisuutta muodostamalla lisäpaketteja, joiden avulla voidaan vastata alakohtaisiin
51
tutkimustarpeisiin- (Siemens & Baker, 2012a; The R Foundation, 2016) Weka on avoi-
men lähdekoodin sarja koneoppimisen algoritmeja datalouhintaan ja osia siitä on
otettu käyttöön muissa tuotteissa, kuten RapidMinerissä (Hall et al., 2009; Siemens &
Baker, 2012a). RapidMiner on markkinoiden johtava avoimen lähdekoodin ennusta-
van analytiikan ympäristö. Se on yleistymässä EDM-tutkijoiden joukossa, koska sen
avulla voi joustavasti suorittaa monimutkaista validaatiota. (RapidMiner, 2016;
Siemens & Baker, 2012a)
Kaupalliset työkalut vievät eteenpäin analytiikan käyttöä koulutuksessa. Niitä ovat yri-
tysmaailman työkalut, kuten IBM:n ja SAS:n analytiikkatyökalut; verkko-oppimisym-
päristöjen, kuten Blackboard, tarjoamat analytiikkatyökalut sekä opiskelijajärjestel-
mät, kuten Ellucian.
Näiden yleistyökalujen lisäksi saatavilla on erikoistuneita työkaluja esimerkiksi tietä-
myksen mallintamiseen BKT:n avulla (Chang, Beck, Mostow, & Corbett, 2006), en-
nustavien mallien kehitykseen (Rodrigo, Baker, McLaren, Jayme, & Dy, 2012) sekä
havainnollistamaan opiskelijoiden oppimisen kehittymistä ja opiskelusuoritusten hah-
moja (Koedinger, McLaughlin, & Stamper, 2012).
Infrastruktuurin puolella tärkeä kehitysaskel on ollut datavaraston ja analytiikkapro-
sessorin välisen rajapinnan standardointi xAPI-rajapinnan avulla. xAPI määrittelee
opiskelutoimintojen paketoimisen ja lähettämisen datavarastoon joustavassa, mutta lu-
ettavassa muodossa. Standardinmukainen data vähentää oppimistapahtumien ja eri
verkko-oppimisympäristöjen välistä riippuvuutta. xAPI-spesifikaatio on ottanut vah-
vasti vaikutteita konstruktivismista ja se tarjoaa uusia käyttömahdollisuuksia yleisesti
behavioristisista lähtökohdista kehitettyjen verkko-oppimisympäristöjen joukossa.
xAPI on otettu ensimmäisenä käyttöön yritysmaailmassa, mutta sitä ollaan nopeaan
tahtiin ottamassa myös akateemisessa maailmassa. Muun muassa Sakai ja Blackboard
ovat integroineet sen LMS-tuotteisiinsa. (Kevan & Ryan, 2016)
4.4.4 Rajoitteet
Teknologisten ratkaisujen lisäksi datan valmistelu-, käsittely- ja analysointityöstä ai-
heutuu kustannuksia. Koska datan tallennusjärjestelmissä kapasiteetti on rajoitettu, se
52
asettaa paineen kerättävän datan priorisoinnille. On tärkeää tietää mihin kysymykseen
halutaan vastaus ja mitä tietoa valitaan kerättäväksi. Montaa eri tietolähdettä käytettä-
essä datan täytyy olla samassa muodossa, jotta sitä voidaan analysoida ja tämä aiheut-
taa haasteita etenkin, jos järjestelmiä on hankittu monelta eri toimittajalta. Eri tietoläh-
teiden datan yhdistäminen on lisäksi vaikeaa ja, koska koulutusta koskevat päätökset
ovat yksilön kannalta merkittäviä, datasta tehdyt johtopäätökset täytyy tehdä asianmu-
kaisten standardien mukaan. (Bienkowski et al., 2012)
Henkilökohtaisten tietojen keräämisellä on vaikutuksia yksityisyydensuojaan. Kerät-
tyjen tietojen turvaaminen on todistetusti ongelmallista, mutta toisaalta yksilöllistämi-
nen onnistuu sitä paremmin mitä enemmän tietoa yksilöstä on kerätty. (Bienkowski et
al., 2012) Tietoa kerättäessä, tallennettaessa ja julkaistessa täytyy kiinnittää huomiota
yksityisyydensuojaan, menettelytapaan sekä laillisiin näkökohtiin. Suomessa yksityi-
syydensuojaa toteuttaa henkilötietolaki, joka määrittää mitä ja miten tietoa saa kerätä,
kuinka kerätty tieto suojataan ja mihin tietoa saa käyttää. (Henkilötietolaki, 1999/523)
4.5 Esimerkkejä datatieteen hyödyntämisestä verkko-opetuksessa
Tässä luvussa esitellään kolme eri tapausta, jossa datatiedettä on onnistuneesti sovel-
lettu verkko-opetukseen. Ensimmäinen, ja ehkä kuuluisin, tapaus tulee Yhdysvalloista
Purduen yliopistosta, jossa otettiin käyttöön eräänlainen opiskelun liikennevalojärjes-
telmä. Toinen tapaus tulee Iso-Britanniasta Nottingam Trentin yliopistosta, jossa si-
toutettiin opiskelijoita nk. dashboard-näkymän avulla. Viimeinen tapaus tulee yritys-
maailmasta, jossa parannettiin öljy- ja kaasuteollisuuden toimintatapoja koulutustyö-
kalun avulla.
4.5.1 Purduen yliopisto
Yhdysvaltojen Indianan osavaltiossa sijaitsevan Purduen yliopiston käynnistämä Sig-
nals-projekti on yksi oppimisen analytiikan siteeratuimmista esimerkeistä. (JISC,
2016) Signals-järjestelmän tarkoitus on opiskelijoille palautetta omasta edistymises-
tään tarpeeksi ajoissa, jotta he voisivat pyytää tukea mahdollisen arvosanan korotta-
53
miseksi tai vaihtaakseen kurssia. Signals käyttää opintorekisteristä ja verkko-oppimis-
ympäristöstä kerättyä dataa ja muodostaa kerätystä datasta ”liikennevalot” näyttämään
kuinka riskialttiina kunkin opiskelijan opinnot ovat. Ennustava malli perustuu opiske-
lijan suoritustasoon (tähän asti ansaitut pisteet), työskentelyyn (toiminta verkko-oppi-
misympäristössä), aikaisempi koulumenestys sekä opiskelijan ominaisuudet, kuten ikä
tai yritetyt opintopisteet. Nämä muuttujat painotetaan ja syötetään algoritmiin, joka
tuottaa asianmukaisen liikennevalon värin. Punainen valo merkitsee suurta epäonnis-
tumisen todennäköisyyttä, keltainen mahdollisia ongelmia ja vihreä valo suurta onnis-
tumisen todennäköisyyttä.
Signals-järjestelmän avulla mahdolliset ongelmat havaitaan jo lukukauden toisella vii-
kolla. Opettajat voivat puuttua ongelmiin erilaisilla tavoilla kuten lähettää opiskelijalle
viestin sähköpostitse tai tekstiviestitse tai he voivat järjestää tapaamisen. Vihreän va-
lon voi lähettää positiivisena palautteena, jota opettaja voi täydentää positiivisella vies-
tillä. Negatiivinen palaute voidaan täydentää varoittavalla viestillä. Vaikutukset mitat-
tiin opiskelijoiden arvosanoista ja käytöksestä, jota varten mitattiin toimintaa verkko-
oppimisympäristössä sekä tuen hakemisessa. Kahden vuoden testijakson perusteella
voitiin todeta, että niillä kursseilla, jossa Signals-järjestelmä oli käytössä, oli enemmän
B ja C arvosanoja (12%) ja vastaavasti vähemmän D ja F arvosanoja2. Testijaksolla
perusteella havaittiin myös 14% lisäys niiden opiskelijoiden määrässä, jotka vaihtoivat
kurssia tarpeeksi ajoissa, etteivät heidän kurssiarvosanojen keskiarvonsa tippuneet.
Keskeyttäneiden opiskelijoiden määrä kuitenkin pysyi samana. Testijakson aikana
opiskelijat muuttivat käytöstään tultuaan tietoiseksi riskitasostaan. He pyysivät apua
aikaisemmin ja useammin ja vaikutus pysyi järjestelmän käytön lopettamisenkin jäl-
keen. Lisääntynyt tukipalveluiden hyödyntäminen koettiin hyvin tärkeänä samoin,
kuin opiskelijan ja opettajan välisen kommunikaation ja opiskelijoiden sitoutumisen
parantuminen. Opiskelijat olivat myös tyytyväisiä järjestelmän kautta tapahtuneeseen
viestintään, joka tuntui henkilökohtaiselta ja hyödylliseltä. (JISC, 2016)
2 Arvosana-asteikolla A-F, jossa A on paras arvosana ja F huonoin.
54
4.5.2 Nottingham Trentin yliopisto
Yksi Ison-Britannian merkittävimmistä oppimisen analytiikan sovelluksista löytyy
Nottingham Trentin yliopistossa (NTU), jossa NTU Student Dashboard (suom. opis-
kelijan dashboard) otettiin käyttöön helpottamaan opiskelijoiden, heidän tutoreidensa
ja tukihenkilökunnan välistä kommunikaatiota. (JISC, 2014) Lähtökohtana oli paran-
taa opiskelijoiden sitoutumista sekä heidän saavutuksiaan. Aikaisempi tutkimus oli
paljastanut, että kolmasosa opiskelijoista oli harkinnut keskeyttämistä ensimmäisen
vuoden aikana. He olivat epävarmempia itsestään, välinpitämättömämpiä, muodosti-
vat heikompia sidoksia kanssaopiskelijoihinsa ja tutoreihin sekä todennäköisemmin
keskeyttivät aikaisessa vaiheessa. He jäivät ilman tutoreiden tukea, sillä he eivät pyy-
täneet apua. Näitä ongelmia varten dashboardiin suunniteltiin neljä avainominaisuutta.
Dashboard näyttää saman tiedon opiskelijoille ja henkilökunnalle; se lähettää tutoreille
viestin, jos opiskelija ei työskentele yli kahteen viikkoon; se mahdollistaa tutoreille
muistiinpanojen tekemisen opiskelijoiden kanssa sovituista töistä; sekä siihen ei sisäl-
lytetty demografista tietoa opiskelijasta vaan vain tietoa opiskelijan työnteosta kurssin
aikana. Käyttöönottoa helpotettiin tekemällä työkalusta helppokäyttöinen. Kuvassa 9
käy esille käyttöliittymän yksinkertaisuus.
55
Kuva 9: Esimerkki opiskelijan dashboardista, henkilökunnan näkymä. (JISC, 2014)
Opiskelijan perustiedot kerätään opiskelijatietojärjestelmästä ja varsinainen sitoutu-
misdata kerätään verkko-oppimisympäristöstä ja kulunvalvontajärjestelmästä, tehtä-
vien palautusjärjestelmästä sekä kirjaston tietojärjestelmästä. Mitattavia asioita olivat
muun muassa kirjautumiset verkko-oppimisympäristöön, kulku laitoksen rakennuk-
siin, tehtävien palautusten ja kirjastolainauksien lukumäärä. Valittujen muuttujien pe-
rusteella jokaiselle opiskelijalle annetaan arvosana heidän sitoutumisensa mukaan:
”Korkea”, ”Hyvä”, ”Osittainen”, ”Matala” ja ”Ei Täysin Sitoutunut”.
Dashboardin avulla opiskelijat pystyvät vertaamaan sitoutumistaan muihin opiskeli-
joihin ja keskustelemaan siitä tutorinsa kanssa. Tutor pystyy analysoimaan dataa opis-
kelijaa tarkemmalla tasolla ja hänelle tulee myös ilmoitus, jos opiskelija ei näytä opis-
kelevan yli kahteen viikkoon. Viestin tarkoitus on edesauttaa tutorin ja opiskelijan vä-
listä viestintää.
56
Jo ensitestistä lähtien oli selvää, että opiskelija sitoutuminen vaikutti positiivisesti
opiskelun etenemiseen sekä saavutuksiin. Jatkotutkimuksissa selvisi, että opiskelijan
sitoutumisen taso oli tärkeämpi suoritustason ennustaja kuin esimerkiksi opiskelijan
taustatiedot tai pääsykoetulokset. 81% viimeisen vuoden opiskelijoista, joilla oli kor-
kea sitoutumistaso, suorittivat opintonsa korkein arvosanoin, kun vain 42% alemman
sitoutumistason opiskelijoista ylti samaan tulokseen. 27% ensimmäisen vuoden opis-
kelijoista kertoivat muuttaneensa käytöstään dashboardin tietojen perusteella – osa
opiskelemalla enemmän, osa kilpailemalla keskenään sitoutumisen arvosanoista.
Myös tutoreiden käytös muuttui dashboardin käyttämisen myötä. Dashboardin myötä
he pystyivät kohdentamaan väliintulon paremmin – kolmasosa tutoreista otti opiskeli-
jaan yhteyttä sitoutumistiedon perusteella ja valtaosa tutoreista käyttivät dashboardia
vain kerran viikossa, eikä sillä ollut suurta vaikutusta työmäärään. (JISC, 2014)
Aloite sai vuoden 2014 Times Higher Education Award -palkinnon erinomaisesta
opiskelijatuesta.
4.5.3 PeT-työkalu
Öljy- ja kaasuteollisuudessa puutteellinen koulutus on johtanut useisiin merkittäviin
onnettomuuksiin ja jopa kuolemantapauksiin sekä äärimmäisen arvokkaisiin kalusto-
vahinkoihin ja vähentyneeseen tuottavuuteen. (Boulanger, Seanosky, Baddeley,
Kumar, & Kinshuk, 2014) Onnettomuuksia ja niistä johtuvia kustannuksia voitaisiin
estää tehokkaalla koulutusjärjestelmällä, jota varten kanadalainen tutkimusryhmä ke-
hitti PeT (Procedure evaluation/e-training) -työkalun menetelmien arviointia ja säh-
köistä koulutusta varten. Sen tarkoituksena oli todentaa vakiotoimintatapojen osaami-
nen, varmistaa työvoiman asianmukainen päätöksenteko hätätilanteessa, luoda päte-
vyysportfolio jokaiselle käyttäjälle sekä täydentämään käyttäjien tarvitsemaa tietoa ja
pätevyyttä toteuttaa kriittisiä ja ei-kriittisiä työtehtäviä.
Tietämystä kahdesta eri hätätilan toimintatavasta testattiin monivalintakysymyksillä ja
vastaukset luokiteltiin oikeiksi; vajaiksi, mutta oikeiksi; osittain oikeiksi; enimmäk-
seen vääriksi sekä täysin vääriksi. PeT keräsi dataa koesuorituksesta, kysymyksistä
57
sekä vastausvalinnoista. Kerätystä datasta pystyttiin luomaan malli, jonka avulla voi-
tiin päätellä paitsi työntekijän tietämyksen taso, myös hänen käytöksensä hätätilanteen
sattuessa. Työkalua testattiin vuonna 2014 kahdessa erässä eri käyttäjillä, joilla oli eri-
laiset taustat ja osaamistasot. Tuloksista kävi ilmi, että PeT-työkalun avulla voidaan
tehokkaasti arvioida työvoiman tietämys ja käytös normaali- sekä hätätilanteissa. Se
mahdollistaa jäljitettävän työvoimakoulutuksen ja sen käyttö johtaa parempaan työtur-
vallisuuteen ja parempaan tuottavuuteen. (Boulanger et al., 2014)
4.6 Datatiedettä hyödyntäviä verkko-opetuksen tuotteita
Tässä luvussa kerrotaan kolmesta erilaisesta tuotteesta verkko-opetuksen ja datatieteen
rajapinnassa: Blackboard, Carnegie Learning Cognitive Tutor Algebra sekä SAP Suc-
cessFactors Learning Analytics.
Blackboard on verkko-oppimisympäristöjen markkinajohtaja. (Edutechnica, 2016)
Blackboard Analytics on sen analytiikka-alusta, joka hyödyntää oppimisen analytiik-
kaa. Sen datalähteenä voidaan käyttää muun muassa dataa verkko-oppimisympäris-
töstä, opiskelijatietojärjestelmästä, rahoituksesta ja henkilöstöresursseista. Sen avulla
voi vähentää opiskelijoiden keskeyttämisastetta, analysoida hakijoita, optimoida kou-
lutuslaitoksen taloudenpitoa sekä parantaa opiskelijoiden suorituksia. (Blackboard,
2016a) Lewis & Clark Community College -kansalaisopisto saavutti sen avulla
700 000 dollarin säästöt kolmen lukukauden aikana ja Central Piedmont Community
College -kansalaisopisto paransi sen avulla opiskelijoiden uudelleenilmoittautumisas-
tetta 23%. (Blackboard, 2014a, 2014b) Blackboard myös tuottanut X-Ray Learning
Analytics -lisäosan suosittuun ja avoimeen Moodle -verkko-oppimisympäristöön. Se
analysoi järjestelmän dataa ja tuottaa tietoa opiskelijoiden keskeyttämisriskistä sekä
heidän aktiivisuudestaan, arvosanoistaan sekä keskusteluistaan. (Blackboard, 2016b)
Carnegie Learning Cognitive Tutor (CT) Algebra on älykäs opetusjärjestelmä (ITS)
algebran opetukseen, joka on käytössä sadoissa tuhansissa kouluissa ja lukioissa ym-
päri maailman ja sitä käytetään yhä enemmän myös korkeakouluissa. CT esittää oppi-
materiaalia mukautetusti mallintamalla opiskelijan tietämystä tai osaamista aiheesta
58
ongelmanratkaisun aikana. Tietämyksen mallintaminen tapahtuu BKT:n avulla. Opis-
kelija voi pyytää aiheen mukaisia vihjeitä sekä saa vastattuaan välittömän palautteen,
joka toisinaan koostuu vastauksen oikeellisuuden lisäksi tarkemmasta, aiheenmukai-
sesta palautteesta. CT:n tuottaman datan pohjalta on koulutustiedonlouhinnan mene-
telmien avulla kehitetty malleja tunnistamaan järjestelmän manipulaatiota, tehtävän-
ratkaisuun liittymätöntä toimintaa (eng. off-task behaviour) sekä tunnetiloja. (Fancsali
& Street, 2014)
SAP SuccessFactors Learning Analytics on osa yritysohjelmistojen markkinajohtaja
SAP:n verkko-oppimisympäristötuotetta. Se lähestyy oppimisen analytiikkaa yritysten
tarpeiden näkökulmasta ja pyrkii ennen kaikkea selvittämään, minkälaista vastinetta
sijoitukset henkilöstön koulutukseen tuottavat. Se tuottaa verkko-oppimisympäristön
keräämästä datasta tietoa liittyen yrityksen tarjoaman koulutuksen määrään, tyyppiin,
kustannuksiin ja vaikuttavuuteen. Mittareita ovat esimerkiksi koulutustunnit per opis-
kelija, koulutuksen läpäisykyky sekä kurssien suoritus- ja peruutustasot. Sen yksi
avainominaisuuksista on laajat raportointityökalut sekä oleellisen tiedon keskittävät
dashboardit. (SAP, 2016)
4.7 Datatieteen ja verkko-opetuksen yhteinen tulevaisuus
Tässä luvussa katsotaan hieman datatieteen ja verkko-opetuksen yhteiseen tulevaisuu-
teen ja havaitaan haasteita kasvavien tietomäärien käsittelyn kanssa sekä potentiaalista
kasvua eri sovelluskohteiden kanssa.
Analysoitavat tietomäärät jatkavat kasvamistaan ja tämä johtaa oppimisen ilmiöiden
ja prosessien yhä parempaan ymmärtämiseen, mutta suurten tietomäärien kanssa työs-
kentely tulee aiheuttamaan teknisiä haasteita. (Chatti et al., 2014) Tietomäärät kasva-
vat myös uusien datalähteiden käyttöönoton myötä. Käytettäviä datalähteitä tulevat
olemaan muun muassa luonnontieteisiin liittyvät simulaatiot, opettajien uutisryhmät,
koulupiirien arvosanajärjestelmät sekä opiskelijoiden yhteistyöstä kerätty data.
(Siemens & Baker, 2012a)
59
Suuria datamääriä syntyy myös MOOCeissa, jossa datatiedettä on tähän asti käytetty
enimmäkseen keskeyttämisasteen parantamiseen, mutta potentiaalia sen käytölle löy-
tyy sieltä valtavasti, etenkin opiskelijan oppimiskokemuksen parantamisessa esimer-
kiksi mukautumisen, palautteen ja suosittelujen avulla. Mobiililaitteiden käytön li-
sääntymisen myötä opiskeluympäristössä ei ole enää rajoja, joten oppimisen konteks-
tista tulee entistä tärkeämpää, etenkin työvoiman kouluttamisessa, elinikäisessä oppi-
misessa ja itseopiskelussa, jossa oppiminen voi tapahtua työ- tai vapaa-aikana. Kon-
tekstitiedon tallentaminen mahdollistaa kontekstiriippumattoman oppimisen eli oppi-
miskokemus pysyy yhtenäisenä esimerkiksi työpäivän jälkeen vapaa-ajalle siirryttä-
essä. (Chatti et al., 2014)
Datatiedettä voidaan soveltaa koulutuksessa moneen eri tarkoitukseen ja jokaiseen
niistä tarvitaan omanlaisensa mittarit, jotka nykyisissä sovelluksissa ovat etukäteen
määritelty. Tämä rajoittaa niiden käyttöä ja jatkossa tulee olemaan kysyntää tuotteille,
jossa käyttäjä voi määritellä tavoitteensa ja mitattavat muuttujat. Tämä johtaa myös
avoimempiin tuotteisiin, josta näkee selkeästi mitä se mittaa ja mitä tarkoitusta varten.
Myös dashboard-painotteinen tiedon esittäminen tulee korvautumaan oikea-aikaisella
ja -paikkaisella tiedon esittämisellä. (Chatti et al., 2014)
Datatieteen käyttökohteet koulutuksessa tulevat lisääntymään. Sitä tullaan sovelta-
maan muun muassa opettavaisiin peleihin, opiskelijoiden väliseen kanssakäymiseen,
oppimiseen virtuaalitodellisuudessa sekä opettajankoulutukseen. (Siemens & Baker,
2012a)
60
5 Pohdinta
Tässä tutkielmassa on esitelty verkko-opetusta, datatiedettä ja kuinka jälkimmäistä voi
soveltaa edelliseen. Siinä on käsitelty niiden historiaa, teoreettista pohjaa ja tarkoi-
tusta, punnittu niiden hyötyjä ja haittoja sekä avattu hieman niiden kehityssuuntia.
Kuten on tullut jo esille, oppimisdatan, niin kuin minkään muunkaan datan, analysoin-
nilla ei ole merkitystä, jos ei siitä ei ole hyötyä. Päinvastoin, datan ja ilmiöiden analy-
sointi ja tutkiminen ovat jopa resurssien tuhlausta, jos analyysin tuloksena syntyviä
ideoita ja ajatuksia ei jollain tavalla käytetä hyödyksi. Resursseja siihen tuleekin kulu-
maan, sillä datankeräysinfrastruktuurin pystyttäminen sekä tarvittavan osaamisen ja
työkalujen hankkiminen vaativat paljon aikaa tai rahaa ja todennäköisesti molempia.
Jotta varmistetaan, että panostetuille resursseille saadaan riittävästä vastinetta, täytyy
ennen koko datan analysoinnin prosessia määritellä mihin kysymykseen halutaan vas-
taus ja miksi. Pyrkimyksenä on datatiedeprosessista saavutettavan hyödyn maksi-
mointi eli toisin sanoen tärkeimmän kysymyksen tunnistaminen. Liiketaloudessa voisi
olla kyse rahassa mitattavasta ROI:sta ja akateemisissa piireissä oppimisen laadun
maksimointi. Kysymyksen määrittelyn merkitystä kuvaa kuuluisa sanonta ”Jos mi-
nulla olisi tunti aikaa ratkaista jokin ongelma, käyttäisin 55 minuuttia ongelman poh-
timiseen ja 5 minuuttia ratkaisuihin.”. Oikea kysymys johtaa sateenkaaren juurelle,
mutta väärä kysymys muuttaa datatieteen seireenin kutsuksi, joka lupaa satumaista on-
nea, mutta johtaa vain karikkoihin ja epäonneen.
Datatieteen käytössä verkko-opetuksessa on haasteensa, mutta en epäile, etteikö niistä
päästäisi yli tai vähintäänkin saadaan muodostettua hyväksyttäviä kompromisseja. Da-
tatiedettä ei vain ole varaa jättää käyttämättä verkko-opetuksessa – niin suuret siitä
saatavat hyödyt ovat. Tärkein hyöty verkko-opetuksen datatieteestä syntyy varmasti
opiskelijoille, jotka hyötyvät verkko-opetuksen data-analytiikasta monella tapaa. Op-
piminen parantuu, kun mukautuva oppimateriaali tarjoaa sopivan haastetason kehityk-
selle, oikea-aikainen ja henkilökohtainen palaute tukee oppimista sekä mahdollisuus
oman suoritustason vertaamisen muiden opiskelijoiden suoritustasoon voi motivoida.
61
Parantunut opintopolkujen suunnittelu helpottaa opiskelun suunnittelua, vaikka henki-
lökohtaista opiskelijanohjausta ja -tukea tarvitaan vieläkin. Datatiedettä harjoitettaessa
tulisi kuitenkin olla mahdollisimman avoin opiskelijalle siitä datasta, mitä heistä kerä-
tään. Jos kerättävää dataa ei olla riittävän avoimia ja läpinäkyviä, on riski siitä, etteivät
opiskelijat tiedä mitä heidän toiminnastaan tallennetaan ja mitä ei. Tämä voi luoda
vähimmilläänkin epäselvyyttä sekä epäluottamusta ja pahimmillaan vainoharhaa,
koska jos ei tiedetä mitä mitataan, ihmiselle on luonteenomaista käyttäytyä kuin kaik-
kea mitataan ja tämä voi aiheuttaa turhaa stressiä opiskelijoille. Tietenkin on olemassa
riski, että jos tiedetään mitä mitataan, voidaan vaikuttaa suoraan niihin muuttujiin ja
käyttää niitä epäreilusti hyväksi ja se vääristää kerättyjä tuloksia. Tämä riski on otet-
tava ja suunniteltava analyysiprosessi sellaiseksi, että se käyttää hyväksi riittävää mää-
rää muuttujia, jotta muutaman manipulaatio ei vääristä tuloksia liiaksi.
Kerätystä datasta muodostettu opiskelijan oppimismalli tulisi voida tallentaa tietova-
rastoon, jota kautta sovellukset voisivat sitä käyttää. Ei ole järkeä kerätä opiskelijasta
tietoa koko oppimispolun ajan ja olla hyödyntämättä sitä sen jälkeen, kun hän lopettaa
viimeisetkin opintonsa. Etenkin nykyisenä elinikäisen oppimisen aikakautena olisi
hyvä saada jonkinlainen kansallinen varasto henkilökohtaiselle tiedolle, jonne oppi-
mismallin tai -profiilin voisi säilöä ja käyttää niin työhön, jatko-opiskeluun kuin va-
paa-aikaankin liittyvien opintojen yhteydessä.
Yksi tärkeä tekijä paremmissa oppimistuloksissa on myös parempi opetus, jonka da-
tatiede verkko-opetuksessa mahdollistaa. Mittarit, joista näkee opiskelijoiden tietä-
mys- ja suoritustason, oppimisprosessin haasteelliset kohdat sekä nopea ja henkilö-
kohtainen palautteen anto parantavat selkeästi opetusta. Mutta vain jos niitä käytetään.
Jo nykyisiin verkko-oppimisympäristöihin siirryttäessä on kohdattu vahvaakin muu-
tosvastarintaa opettajissa. Osaksi se on terveellistä hyödyn kyseenalaistamista, ettei
omaksuta suin päin uusia teknologioita, mutta etenkin silloin, kun hyödyt on jo toteen
näytetty, voi olla kyse muutoksen pelosta ja haluttomuudesta uusiutua. Tätä voidaan
lievittää merkittävästä hiomalla verkko-oppimisympäristöjen ja oppimisen hallintajär-
jestelmien sekä niiden analyyttisten työkalujen käytettävyys huippuunsa. Ohjelmisto-
jen käyttökynnys on saatava mahdollisimman alas ja tehdä vaivattomaksi käyttää.
62
Preskriptiivisen analytiikan keinoin sen voi tehdä jopa kädestä pitävän ohjaavaksi.
Toisaalta kehittyneille käyttäjille on annettava myös enemmän mahdollisuuksia ja työ-
kaluja käyttöön.
Datatieteen käytöstä verkko-opetuksessa hyötyvät myös koulutuslaitokset ja koulu-
tusta tarjoavat työpaikat. Opiskelijoiden parempi suoriutuminen on toki sinänsä jo kil-
pailuvaltti, mutta koska datatiede myös tehostaa opettamista, opettajat ja kouluttajat
voivat kouluttaa suuremman määrän opiskelijoita vähemmällä vaivalla. Näin korote-
tusta opiskelun tasosta hyötyvät yhä useammat opiskelijaa, etenkin koska datatieteen
avulla voidaan vähentää opiskelijoiden keskeyttämistä.
Edellä esiteltyjen tulevaisuuden kuvauksien lisäksi odotan, että verkko-opetus yhdis-
tetään preskriptiiviseen analytiikkaan, josta saatavat suosittelut voisivat parantaa ope-
tuksen tasoa. Näen mielessäni jo opettajan dashboardin, jossa kurssin suoritustietoja
tarkastellessa voisi hälytyksen lailla tulla esille, että tämä tietty kurssinosa aiheuttaa
ongelmia opiskelijoille ja tässä toimintaehdotus sen parantamiseksi. Opettaja saisi tie-
tenkin käyttää omaa harkintakykyään ongelman vahvistamiseen ja korjaamiseen,
mutta suositukset varmasti virtaviivaistaisivat opetusprosessia. Preskriptiivisestä ana-
lytiikasta olisi hyötyä etenkin suurten opiskelija- ja kurssimäärien kanssa työskennel-
lessä, jolloin pienetkin optimoinnit kertautuvat suuriksi hyödyiksi.
Lisääntyvä AR- (Augmented Reality, lisätty todellisuus) ja VR- (Virtual Reality, vir-
tuaalitodellisuus) -teknologioiden käyttö luo myös kiehtovia mahdollisuuksia datatie-
teelle ja verkko-opetukselle. Käyttäjän toiminnan ja tietotason perusteella mukautuvat
virtuaaliympäristöt tuntuvat lähes käsittämättömiltä, mutta ovat mahdollisia toteuttaa
lähitulevaisuudessa. Esimerkiksi aloitteleva biologian opiskelija pääsisi tutustumaan
lammen eliöstöön uimalla siellä virtuaalisesti, kun taas osaavampi opiskelija voi löytää
itsensä virtuaalisesta viidakosta tutkimassa jo sukupuuttoon kuolleita eliölajeja. AR
voisi olla mielenkiintoinen lisä visualisointiteknologioihin. Opettaja voisi luokkaa
opettaessaan nähdä opiskelijoiden suoritustiedot ja niihin liittyvät ilmoitukset lisättynä
kerroksena todellisuuden päällä. Näin ei olisi tarvetta katsoa koko ajan dashboardia
vaan tiedon saa suoraan kontekstissaan.
63
Viitteet
Ali, M. (2016). Data Science Process: How to collect the right data. Retrieved June
2, 2016, from https://www.linkedin.com/pulse/data-science-process-how-
collect-right-mohammed-ali
Altintas, I., & Gupta, A. (2016). Acquiring Data. Retrieved June 2, 2016, from
https://www.coursera.org/learn/intro-to-big-data/lecture/esxnG/step-1-
acquiring-data
Arkorful, V., & Abaidoo, N. A. (2015). The role of e-learning, advantages and
disadvantages of its adoption in higher education. International Journal of
Instructional Technology and Distance Learning, 12(1), 29–43.
Auvinen, P., Hirvonen, K., Maso, R. D., & Kallberg, K. (2007). Opetussuunnitelma
ammattikorkeakoulussa.
Baker, R. S., Corbett, A. T., Koedinger, K. R., & Wagner, A. Z. (2004). Off-task
behavior in the cognitive tutor classroom: When students “game the system.”
Proceedings of the ACM Conference on Human Factors in Computing Systems,
383–390. http://doi.org/10.1145/985692.985741
Baker, R. S. J. D., Corbett, A. T., & Aleven, V. (2008). More accurate student
modeling through contextual estimation of slip and guess probabilities in
bayesian knowledge tracing. Lecture Notes in Computer Science (Including
Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in
Bioinformatics), 5091 LNCS, 406–415. http://doi.org/10.1007/978-3-540-
69132-7-44
Bandyopadhyay, R. (2016). The Data Science Process. Retrieved June 2, 2016, from
http://www.kdnuggets.com/2016/03/data-science-process.html
Berry, J. (1994). Database Marketing. Businessweek. Retrieved from
http://www.bloomberg.com/news/articles/1994-09-04/database-marketing
Bertolucci, J. (2013). Big Data Analytics: Descriptive Vs. Predictive Vs.
Prescriptive. InformationWeek. Retrieved from
64
http://www.informationweek.com/big-data/big-data-analytics/big-data-
analytics-descriptive-vs-predictive-vs-prescriptive/d/d-id/1113279
Bienkowski, M., Feng, M., & Means, B. (2012). Enhancing teaching and learning
through educational data mining and learning analytics: An issue brief.
Washington, DC: SRI International, 1–57. Retrieved from
http://www.ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf
Bitzer, D. L., Lyman, E. R., & Easley, J. A. J. (1966). The uses of Plato: a computer
controlled teaching system. In H. Goldhor (Ed). 1966. Proceedings of the 1966
Clinic on Library Applications of Data Processing, 107(2), 34–46. Retrieved
from https://www.ideals.uiuc.edu/handle/2142/1760
Blackboard. (2014a). Blackboard Analytics for Student and Institutional Insight.
Blackboard. Improving the re-enrollment rate through proactive outreach (2014).
Blackboard. (2016a). Blackboard Analytics. Retrieved June 25, 2016, from
https://www.blackboard.com/education-data-analytics/blackboard-
analytics.aspx
Blackboard. (2016b). X-Ray Learning Analytics. Retrieved June 24, 2016, from
https://en-us.help.blackboard.com/Moodlerooms/Teacher/Track_Progress/X-
Ray_Learning_Analytics
Boulanger, D., Seanosky, J., Baddeley, M., Kumar, V., & Kinshuk. (2014). Learning
Analytics in the Energy Industry: Measuring Competences in Emergency
Procedures. Technology for Education (T4E), 2014 IEEE Sixth International
Conference on. http://doi.org/10.1109/T4E.2014.44
Bucky, C. (2016). Intro to data analysis. Retrieved March 15, 2016, from
https://www.udacity.com/course/intro-to-data-analysis--ud170
Chang, K. M., Beck, J., Mostow, J., & Corbett, A. (2006). A bayes net toolkit for
student modeling in intelligent tutoring systems. Lecture Notes in Computer
Science (Including Subseries Lecture Notes in Artificial Intelligence and
Lecture Notes in Bioinformatics), 4053 LNCS, 104–113.
http://doi.org/10.1007/11774303_11
65
Chatti, A. M., Lukarov, V., Thüs, H., Muslim, A., Yousef, F. A. M., Wahid, U., …
Schroeder, U. (2014). Learning Analytics: Challenges and Future Research
Directions. Eleed, 10(1). Retrieved from http://nbn-
resolving.de/urn:nbn:de:0009-5-40350
Contact North. (2013). Reducing Costs through Online Learning. Retrieved from
http://teachonline.ca/sites/default/files/tools-
trends/downloads/reducing_costs_through_online_learning.pdf
Conway, D. (2015). The Data Science Venn Diagram. Retrieved May 14, 2016, from
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
Cross, J. (2004). An informal history of eLearning. On the Horizon, 12(3), 103–110.
http://doi.org/10.1108/10748120410555340
D’Mello, S. K., Craig, S. D., Witherspoon, A., McDaniel, B., & Graesser, A. (2008).
Automatic detection of learner’s affect from conversational cues. User
Modeling and User-Adapted Interaction, 18(1-2), 45–80.
http://doi.org/10.1007/s11257-007-9037-6
Davenport, T. H. (2013). Telling a Story with Data : Communicating effectively with
analytics. Deloitte Review. Retrieved from http://dupress.com/articles/telling-a-
story-with-data/
Edutechnica. (2016). LMS Data – Spring 2016 Updates. Retrieved from
http://edutechnica.com/2016/03/20/lms-data-spring-2016-updates/
Emin-Martínez, V., Hansen, C., Rodríguez-Triana, M. J., Wasson, B., Mor, Y.,
Dascalu, M., … Pernin, J.-P. (2014). Learning Analytics and Assessment.
Elearning Papers, (36), 1–48. Retrieved from
www.openeducationeuropa.eu/en/elearning_papers
Fancsali, S., & Street, G. (2014). Causal Discovery with Models : Behavior , Affect ,
and Learning in Cognitive Tutor Algebra. Proceedings of the 7th International
Conference on Educational Data Mining (EDM), (Edm), 28–35. Retrieved from
http://educationaldatamining.org/EDM2014/uploads/procs2014/long
papers/28_EDM-2014-Full.pdf
66
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to
knowledge discovery in databases. AI Magazine, 37–54.
http://doi.org/10.1145/240455.240463
Granville, V. (2014). Best solution to a problem: data science versus statistical
paradigm. Retrieved June 27, 2016, from
http://www.datasciencecentral.com/profiles/blogs/best-solution-to-a-problem-
data-science-versus-statistical-paradi
Greitzer, F. L. (2002). A Cognitive Approach to Student-Centered E-Learning.
Proceedings of the Human Factors and Ergonomics Society Annual Meeting,
46(25), 2064–2068. http://doi.org/10.1177/154193120204602515
Guo, P. (2013). Data Science Workflow. Retrieved May 3, 2016, from
http://cacm.acm.org/blogs/blog-cacm/169199-data-science-workflow-overview-
and-challenges/fulltext
Gutierrez, D. D. (2014). Ask a Data Scientist: The Data Science Process. Retrieved
June 2, 2016, from http://insidebigdata.com/2014/11/12/ask-data-scientist-data-
science-process/
Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., & Witten, I. H.
(2009). The WEKA Data Mining Software: An Update. SIGKDD Explorations,
11(1).
Halo Business Intelligence. (2016). Descriptive, Predictive, and Prescriptive
Analytics Explained. Retrieved June 30, 2016, from
https://halobi.com/2014/10/descriptive-predictive-and-prescriptive-analytics-
explained/
Harris, N., & Sandor, M. (2007). Developing online discussion forums as student
centred peer e-learning environments. Ascilite 2007 - ICT: Providing Choices
for Learners and Learning, 383–387. Retrieved from
www.ascilite.org.au/conferences/singapore07/procs/harris.pdf
Harvard. (2016). Data Science Certificate. Retrieved June 27, 2016, from
https://www.extension.harvard.edu/academics/professional-graduate-
67
certificates/data-science-certificate
Hellström, M. (2008). Sata sanaa opetuksesta - Keskeisten käsitteiden käsikirja.
Jyväskylä: PS-kustannus.
Helsingin yliopisto. (2016). MOOC on väylä yliopistoon. Retrieved June 30, 2016,
from http://mooc.fi/courses/2016/ohjelmoinnin-mooc/opinto-oikeus.html
Henkilötietolaki, Pub. L. No. 523 (1999).
Ihanainen, P., Hietala, P., Mäkinen, P., Rannikko, S., & Keskinen, A. (2004).
Verkko-oppimisen käytäntöjä, malleja ja työkaluja. Helsinki: Opetushallitus.
Ilomäki, L. (2008). Sähköä opetukseen! : digitaaliset oppimateriaalit osana
oppimisympäristöä. Retrieved from
https://oula.linneanet.fi/vwebv/holdingsInfo?bibId=1025066\nhttp://www.oph.fi
/download/46732_sahkoa_opetukseen.pdf
Ilvonen, I., Jussila, J., & Kukko, M. (2013). Tietojohtaminen. Tampere.
Jain, P. (2013). Data Science or Analytics? Retrieved May 3, 2016, from
http://www.forbes.com/sites/piyankajain/2013/02/25/data-science-or-analytics/
JISC. (2014). CASE STUDY I : Predictive analytics at Nottingham.
JISC. (2016). CASE STUDY A : Traffic lights and interventions : Signals at Purdue
University. Retrieved from
https://analytics.jiscinvolve.org/wp/files/2016/04/CASE-STUDY-A-Purdue-
University.pdf
Jokela, M. (2011). Mitä tieto on? Retrieved May 10, 2016, from http://inside-the-
plm.blogspot.fi/p/mita-tieto-on_12.html
Kevan, J. M., & Ryan, P. R. (2016). Experience API: Flexible, Decentralized and
Activity-Centric Data Collection. Technology, Knowledge and Learning, 21(1),
143–149. http://doi.org/10.1007/s10758-015-9260-x
Koedinger, K., McLaughlin, E., & Stamper, J. (2012). Automated Student Model
Improvement. Educational Data Mining, Proceedings of the 5th International
Conference on, 17–24. http://doi.org/10.978.17421/02764
68
Koohang, A., Riley, L., Smith, T., & Schreurs, J. (2009). E-Learning and
Constructivism : From Theory to Application E-Learning and E-Learning
Design What is Constructivism ? Elearning, 5, 91–109. Retrieved from
http://www.mendeley.com/research/elearning-constructivism-theory-
application-elearning-elearning-design-constructivism/
Kotimaisten kielten keskus. (2016). Kielitoimiston sanakirja. Retrieved from
http://www.kielitoimistonsanakirja.fi/
Lakkala, M. (2002). Verkko-oppimisen organisointi ja ohjaaminen kohti tutkivaa
ongelmakeskeistä oppimista.
Laney, D. (2015). The Gartner Analytic Continuum. Retrieved June 29, 2016, from
https://twitter.com/doug_laney/status/611172882882916352
Lepistö, L. (2008). Ammatillinen opettajakorkeakoulu, 1–34.
Lohr, S. (2014). For Big-Data Scientists, “Janitor Work” Is Key Hurdle to Insights.
New York Times. Retrieved from
http://www.nytimes.com/2014/08/18/technology/for-big-data-scientists-hurdle-
to-insights-is-janitor-work.html
Loukides, M. (2010). What is data science? Retrieved April 12, 2016, from
https://www.oreilly.com/ideas/what-is-data-science
Macfadyen, L. P., & Dawson, S. (2010). Mining LMS data to develop an “early
warning system” for educators: A proof of concept. Computers and Education,
54(2), 588–599. http://doi.org/10.1016/j.compedu.2009.09.008
Manninen, J. (2001). Verkko-pedagogiikka. Retrieved from
http://tievie.oulu.fi/koulutusresurssit/kalvot/2001/espoo/verkkopedagogiikka_te
oriaa_ja_kaytantoa.pdf
Marr, B. (2014). Big Data: The 5 Vs Everyone Must Know. Retrieved May 14, 2016,
from https://www.linkedin.com/pulse/20140306073407-64875646-big-data-the-
5-vs-everyone-must-know
Marr, B. (2015). Big Data In The Amazing World of Gaming. Retrieved June 2,
2016, from http://www.datasciencecentral.com/profiles/blogs/big-data-in-the-
69
amazing-world-of-gaming
Marr, B. (2016a). Big Data: A Game Changer in Healthcare. Retrieved June 2, 2016,
from http://www.forbes.com/sites/bernardmarr/2016/05/24/big-data-a-game-
changer-in-healthcare
Marr, B. (2016b). Big Data: Will We Soon No Longer Need Data Scientists?
Retrieved June 5, 2016, from
http://www.forbes.com/sites/bernardmarr/2016/04/27/will-we-soon-no-longer-
need-data-scientists/
Marr, B. (2016c). How Big Data And Analytics Are Transforming The Construction
Industry. Retrieved June 2, 2016, from
http://www.forbes.com/sites/bernardmarr/2016/04/19/how-big-data-and-
analytics-are-transforming-the-construction-industry
Marr, B. (2016d). How VR Will Revolutionize Big Data Visualizations. Retrieved
June 6, 2016, from http://www.forbes.com/sites/bernardmarr/2016/05/04/how-
vr-will-revolutionize-big-data-visualizations/
Marr, B. (2016e). Why “Big Data” Means Nothing Without “Little Data.” Retrieved
June 28, 2016, from http://www.forbes.com/sites/bernardmarr/2016/06/23/why-
big-data-means-nothing-without-little-data/
MastersInDataScience.org. (2016). Data Science in Insurance. Retrieved June 30,
2016, from http://www.mastersindatascience.org/industry/insurance/
Matsudaira, K. (2015). Communications, 58(06), 44–47.
http://doi.org/10.1145/2745390
Nevgi, A., Löfström, E., & Evälä, A. (2005). Laadukkaasti verkossa: Yliopistollisen
verkko-opetuksen ulottuvuudet (Vol. 7).
NYU. (2013). What is Data Science? Retrieved June 27, 2016, from
http://cds.nyu.edu/research/
Opetushallitus. (2011). Tieto- ja viestintätekniikka opetuskäytössä - Välineet,
vaikuttavuus ja hyödyt. Tilannekatsaus toukokuu 2011. Retrieved from
http://www.oph.fi/julkaisut/2011/tieto_ja_viestintatekniikka_opetuskaytossa
70
Pandey, R. (2014). Building Analytics into the Insurance Value Chain. Retrieved
June 2, 2016, from http://www.analyticbridge.com/profiles/blogs/building-
analytics-into-the-insurance-value-chain
Parkin, S. (2015). Gaming Your Brain. ESPN The Magazine. Retrieved from
http://espn.go.com/espn/story/_/id/13065280/video-game-data-science-profit
Patil, D. J. (2011). Building data science teams. Retrieved May 31, 2016, from
http://radar.oreilly.com/2011/09/building-data-science-teams.html
Piatetsky-Shapiro, G. (2012). From Data Mining to Big Data and Beyond. Retrieved
June 27, 2016, from http://insideanalysis.com/2012/04/data-mining-and-beyond/
Pirilä, A. (2013). VERKKO-OPETUKSEN MAHDOLLISUUDET JA HAASTEET.
Retrieved from
https://publications.theseus.fi/bitstream/handle/10024/60502/Pirila_Armi.pdf
Press, G. (2013). A Very Short History Of Data Science. Retrieved May 17, 2016,
from http://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-
data-science/
Provost, F., & Fawcett, T. (2013). Data Science and its Relationship to Big Data and
Data-Driven Decision Making. Data Science and Big Data, 1(1), 51–59.
http://doi.org/10.1089/big.2013.1508
Pylkkä, O. (2010). Oppimiskäsitykset. Retrieved January 17, 2016, from
http://oppimateriaalit.jamk.fi/oppimiskasitykset/
Quitzau, A. (2014). Big Data Analytics in Energy & Utilities. Retrieved from
http://www.slideshare.net/AndersQuitzauIbm/big-data-analyticsin-energy-
utilities
Raitala, S., & Ylilehto, H. (2012). Parempi oppia yhdessä – tukea eTwinning-
hankkeesta.
RapidMiner. (2016). RapidMiner. Retrieved June 20, 2016, from
http://rapidminer.com/
Rodrigo, M., Baker, R., McLaren, B., Jayme, A., & Dy, T. (2012). Development of a
71
workbench to address the educational data mining bottleneck. Proceedings of
the 5th International Conference on Educational Data Mining, 152–155.
Rojas, N. (2015). Healthcare Industry Finds New Solutions to Big Data Storage
Challenges. Retrieved June 2, 2016, from
http://www.datasciencecentral.com/profiles/blogs/healthcare-industry-finds-
new-solutions-to-big-data-storage
Ryann K. Ellis. (2010). A Field Guide to Learning management systems.
International Anesthesiology Clinics, 48(3), 27–51.
http://doi.org/10.1097/AIA.0b013e3181e5c1d5
SAP. (2016). SAP SuccessFactors Learning Analytics.
Schutt, R., & O’Neil, C. (2013). Doing data science.
http://doi.org/10.5860/CHOICE.51-6803
Sclater, N., Peasgood, A., & Mullan, J. (2016). Learning analytics in higher
education : A review of UK and international practice Full report, (April), 40.
Retrieved from https://www.jisc.ac.uk/sites/default/files/learning-analytics-in-
he-v2_0.pdf
Sen, S. (2016). Caring about Analytics for HR. Retrieved June 2, 2016, from
http://www.datasciencecentral.com/profiles/blogs/caring-about-analytics-for-hr
Shung, K. P. (2014). Stages in the Analytics/Data Science Process. Retrieved June 2,
2016, from https://www.linkedin.com/pulse/20140822130955-4710606-stages-
in-the-analytics-data-science-process
Siemens, G., & Baker, R. S. J. D. (2012a). Learning analytics and educational data
mining. Proceedings of the 2nd International Conference on Learning Analytics
and Knowledge - LAK ’12, 252. http://doi.org/10.1145/2330601.2330661
Siemens, G., & Baker, R. S. J. d. (2012b). Learning Analytics and Educational Data
Mining: Torwards Communication and Collaboration. Proceedings of the 2nd
International Conference on Learning Analytics and Knowledge - LAK ’12,
252–254. http://doi.org/10.1145/2330601.2330661
Siemens, G., Gasevic, D., Haythornthwaite, C., Dawson, S., Buckingham Shum, S.,
72
Ferguson, R., … Oblinger, D. G. (2007). Open Learning Analytics: an
integrated & modularized platform Proposal to design, implement and evaluate
an open platform to integrate heterogeneous learning analytics techniques
Project Overview. EDUCAUSE Review, 42(4), 53–54.
Small, G., & Vorgan, G. (2008). Meet Your iBrain. Scientific American Mind, 19(5),
42–49. Retrieved from
http://search.ebscohost.com.ezproxy.uef.fi:2048/login.aspx?direct=true&db=ap
h&AN=34939318&site=ehost-live
Stanton, J. (2013). An introduction to data science. Syracuse University, (2012), 195.
Stone, D. E., & Zheng, G. (2016). Learning Management Systems in a Changing
Environment. Handbook of Research on Education and Technology in a
Changing Society, (JANUARY 2014), 756–767. http://doi.org/10.4018/978-1-
4666-6046-5.ch056
Swan, A., & Brown, S. (2008). The skills, role and career structure of data scientists
and curators: An assessment of current practice and future needs. A Report to
the Joint Information Systems Committee (JISC), July, 34. Retrieved from
http://www.jisc.org.uk/media/documents/programmes/digitalrepositories/dataski
llscareersfinalreport.pdf
Taipalmaa, H. (2008). VERKKO-OPETUSMENETELMÄT.
Tella, S., Vahtivuori, S., Vuorento, A., Wager, P., & Oksanen, U. (2001). Verkko
opetuksessa – opettaja verkossa. Helsinki: Edita.
Tervo, U. (2012). VERKKO-OPETTAJAN ABC Risto Kivipensas.
The R Project for Statistical Computing. (2016). Retrieved June 30, 2016, from
https://www.r-project.org/
Upadhyaya, M. (2014). Impact of big data on analytics. Retrieved May 31, 2016,
from https://www.slideshare.net/slideshow/embed_code/36866068
Walker, B. (2015). Every Day Big Data Statistics. Retrieved April 12, 2016, from
http://www.vcloudnews.com/every-day-big-data-statistics-2-5-quintillion-bytes-
of-data-created-daily/
73
Walker, M. (2012a). Data Veracity. Retrieved May 14, 2016, from
http://www.datasciencecentral.com/profiles/blogs/data-veracity
Walker, M. (2012b). Predictive, Descriptive, Prescriptive Analytics. Retrieved June
2, 2016, from www.analyticbridge.com/profiles/blogs/predictive-descriptive-
prescriptive-analytics
Walker, M. (2013). Data Science and Predictive Analytics Strategy for Marketing.
Retrieved from http://www.datasciencecentral.com/profiles/blogs/data-science-
and-predictive-analytics-strategy-for-marketing
Veermans, M. (2004). Keksivä oppiminen. Laatua E-Oppimateriaaleihin. Retrieved
from http://www.opetushallitus.fi/download/144415_Laatua_e-
oppimateriaaleihin_2.pdf#page=100
Wladawsky-Berger, I. (2014). Why Do We Need Data Science when We’ve Had
Statistics for Centuries? Retrieved June 27, 2016, from
http://blog.irvingwb.com/blog/2014/04/why-do-we-need-data-science-when-
weve-had-statistics-for-centuries.html
Vorhies, W. (2014). Types and Uses of Predictive Analytics, What they are and
Where You Can Put Them to Work. Retrieved June 27, 2016, from
http://www.datasciencecentral.com/profiles/blogs/types-and-uses-of-predictive-
analytics-what-they-are-and-where
Wu, M. (2013a). Big Data Reduction 2: Understanding Predictive Analytics.
Retrieved June 2, 2016, from https://community.lithium.com/t5/Science-of-
Social-blog/Big-Data-Reduction-2-Understanding-Predictive-Analytics/ba-
p/79616
Wu, M. (2013b). Big Data Reduction 3: From Descriptive to Prescriptive. Retrieved
June 5, 2016, from https://community.lithium.com/t5/Science-of-Social-
blog/Big-Data-Reduction-3-From-Descriptive-to-Prescriptive/ba-p/81556
Recommended