30
Data- ja informaatioanalytiikka 5.4.2016 Sosiaalisen median analytiikka TkT Jari Jussila

Sosiaalisen median analytiikka

Embed Size (px)

Citation preview

Page 1: Sosiaalisen median analytiikka

Data- ja informaatioanalytiikka

5.4.2016 Sosiaalisen median analytiikka

TkT Jari Jussila

Page 2: Sosiaalisen median analytiikka

Big Data transaktioista interaktioihin

WEB

BIG DATA

Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013

ERP

CRM

ostotiedot maksutiedot

segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit

weblogit

tarjoushistoria A/B testaaminen

Dynaaminen hinnoittelu

Hakukonemarkkinointi ja optimointi

Mainosverkostot

Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit

Ulkopuolinen demografia

Kuvat ja videot

Puheen muuttaminen tekstiksi

Feedit

Anturi/sensoridata

Tuote / palvelu logit

SMS/MMS

Käyttäjien luoma sisältö Mobiilidata

Klikkivirran analyysi

Sijaintidata

Sosiaaliset verkostot

Sosiaalinen media Sentimentti

Page 3: Sosiaalisen median analytiikka

Sentimenttianalyysi

Sentiment Analysis

Page 4: Sosiaalisen median analytiikka

Sentimenttianalyysi

Positiivinen Neutraali Negatiivinen

Page 5: Sosiaalisen median analytiikka

Esimerkki Twitter keskusteluiden sentimenttianalyysista

Lähde: NEMO Sentiment & Data analyzer

Page 6: Sosiaalisen median analytiikka

Sentimentti aikajana esityksenä

Lähde: NEMO Sentiment & Data analyzer

Page 7: Sosiaalisen median analytiikka

TOP 10 henkilöä viestien määrän suhteen

Lähde: NEMO Sentiment & Data analyzer

Page 8: Sosiaalisen median analytiikka

Mitä hyötyä voisi olla sentimenttianalyysistä?

Page 9: Sosiaalisen median analytiikka

Viikkoharjoitus 4: Tee-se-itse sentimenttianalyysi

•  Vaihtoehtoja sentimenttianalyysin tekemiseen a)  Analytiikkasovellukset (advanced analytics)

•  SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html •  SPSS Text Analytics for Surveys

http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys •  RapidMiner https://rapidminer.com/solutions/sentiment-analysis/

b)  Sosiaalisen median analytiikkasovellukset •  Hootsuite https://hootsuite.com/products/insights •  Meltwater http://www.meltwater.com/fi/ •  …

c)  Sentimenttianalyysisovellukset •  NEMO Sentiment & Data analyzer http://seda.cloudapp.net/ •  SentiStrenght http://sentistrength.wlv.ac.uk/ •  …

d)  Ohjelmalliset lähestymistavat •  R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/ •  Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/ •  …

9/6

Page 10: Sosiaalisen median analytiikka

Sentimenttianalyysi live demo

Page 11: Sosiaalisen median analytiikka

Sentiment Analysis in Tableau using R

Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s

Page 12: Sosiaalisen median analytiikka

Sentimenttianalyysia Tableaussa käyttäen R •  Asenna seuraavat ohjelmistot:

–  R https://www.r-project.org/ –  Rstudio https://www.rstudio.com/

•  ja tarvittavat R-kirjastot –  TM, NLP ja Rserve –  Rstem

https://cran.r-project.org/src/contrib/Archive/Rstem/ –  Sentiment

https://cran.r-project.org/src/contrib/Archive/sentiment/

Page 13: Sosiaalisen median analytiikka

Ota kirjastot käyttöön ja käynnistä R palvelu (run.Rserve)

Page 14: Sosiaalisen median analytiikka

Yhdistä Tableau ja R (Manage R Connection)

Page 15: Sosiaalisen median analytiikka

Luo Tableaussa uusi laskennallinen kenttä •  SCRIPT_STR('classify_polarity(.arg1,algorith

m="bayes", verbose=TRUE)[,4]',ATTR([Text]))

Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/

Page 16: Sosiaalisen median analytiikka

Verkostoanalyysi

Social Network Analysis (SNA)

Page 17: Sosiaalisen median analytiikka

Solmut, yhteydet ja verkostot

Tähti

Ympyrä

Ketju

Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille

Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen

Löyhempi kuin tähti, mutta keskittyneempi kuin ympyrä

0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0

0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0

0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0

Page 18: Sosiaalisen median analytiikka

18/6

Verkostojen anatomia

Page 19: Sosiaalisen median analytiikka

Keskeisempiä käsitteitä liittyen verkostoanalyysiin

19

KESKEISYYS ARVOSTUS

TÄRKEYS

Lähde: Wasserman & Faust 1994

Keskeisyysaste Läheisyys Degree Prestige

Proximity Prestige

Välillisyys Informaation keskeisyys

Status or Rank Prestige

Page 20: Sosiaalisen median analytiikka

•  Keskeisyysaste (degree) •  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin

toimijoihin

•  Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree)

•  Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.

20

Keskeisyysaste (asteluku)

Lähde: Wasserman & Faust 1994

Page 21: Sosiaalisen median analytiikka

•  Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa

•  Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin

•  dij on lyhyimmän polun pituus i:n ja j:n välillä

•  Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä

∑=

=n

ijiji dc

Läheisyys

Lähde: Wasserman & Faust 1994

Page 22: Sosiaalisen median analytiikka

•  Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu

•  Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat)

•  Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri

22

Välillisyys

Lähde: Wasserman & Faust 1994

Page 23: Sosiaalisen median analytiikka

Viikkoharjoitus 3: Tee-se-itse Twitter verkostoanalyysi – markkinoinnin näkökulmasta •  Asenna seuraavat ohjelmistot

– Anaconda Python 2.7 https://www.continuum.io/downloads

– Gephi https://gephi.org/ •  Kerää data

– Tätä varten tarvii luoda Twitter sovellus (App) https://apps.twitter.com/

– Nouda twiitit käyttäen seuraavaa skriptiä https://github.com/jukkahuhtamaki/pcm-demo/tree/master/twitter-api

Page 24: Sosiaalisen median analytiikka

Hyödynnetään #ohsiha oppeja ja työkaluja

Page 25: Sosiaalisen median analytiikka

Ohjelmallinen sisällönhallinta 2016

Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016

Page 26: Sosiaalisen median analytiikka

Valitse itselle/ryhmälle mieleinen firma/organisaatio

Page 27: Sosiaalisen median analytiikka

Muokkaa Python koodia Spyderillä ja aja se

Page 28: Sosiaalisen median analytiikka

Avaa gexf (Graph Exchange XML Format) tiedosto Gephillä

Page 29: Sosiaalisen median analytiikka

Laske verkostometriikat ja visualisoi verkosto

Page 30: Sosiaalisen median analytiikka

Kiitokset

•  Jukka Huhtamäki @jnkka #ohsiha •  Harri Jalonen @Jalonen #nemohanke •  Jayesh Gupta @jyshgupta