Upload
jari-jussila
View
901
Download
6
Embed Size (px)
Citation preview
Data- ja informaatioanalytiikka
5.4.2016 Sosiaalisen median analytiikka
TkT Jari Jussila
Big Data transaktioista interaktioihin
WEB
BIG DATA
Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013
ERP
CRM
ostotiedot maksutiedot
segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit
weblogit
tarjoushistoria A/B testaaminen
Dynaaminen hinnoittelu
Hakukonemarkkinointi ja optimointi
Mainosverkostot
Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit
Ulkopuolinen demografia
Kuvat ja videot
Puheen muuttaminen tekstiksi
Feedit
Anturi/sensoridata
Tuote / palvelu logit
SMS/MMS
Käyttäjien luoma sisältö Mobiilidata
Klikkivirran analyysi
Sijaintidata
Sosiaaliset verkostot
Sosiaalinen media Sentimentti
Sentimenttianalyysi
Sentiment Analysis
Sentimenttianalyysi
Positiivinen Neutraali Negatiivinen
Esimerkki Twitter keskusteluiden sentimenttianalyysista
Lähde: NEMO Sentiment & Data analyzer
Sentimentti aikajana esityksenä
Lähde: NEMO Sentiment & Data analyzer
TOP 10 henkilöä viestien määrän suhteen
Lähde: NEMO Sentiment & Data analyzer
Mitä hyötyä voisi olla sentimenttianalyysistä?
Viikkoharjoitus 4: Tee-se-itse sentimenttianalyysi
• Vaihtoehtoja sentimenttianalyysin tekemiseen a) Analytiikkasovellukset (advanced analytics)
• SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html • SPSS Text Analytics for Surveys
http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys • RapidMiner https://rapidminer.com/solutions/sentiment-analysis/
b) Sosiaalisen median analytiikkasovellukset • Hootsuite https://hootsuite.com/products/insights • Meltwater http://www.meltwater.com/fi/ • …
c) Sentimenttianalyysisovellukset • NEMO Sentiment & Data analyzer http://seda.cloudapp.net/ • SentiStrenght http://sentistrength.wlv.ac.uk/ • …
d) Ohjelmalliset lähestymistavat • R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/ • Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/ • …
9/6
Sentimenttianalyysi live demo
Sentiment Analysis in Tableau using R
Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s
Sentimenttianalyysia Tableaussa käyttäen R • Asenna seuraavat ohjelmistot:
– R https://www.r-project.org/ – Rstudio https://www.rstudio.com/
• ja tarvittavat R-kirjastot – TM, NLP ja Rserve – Rstem
https://cran.r-project.org/src/contrib/Archive/Rstem/ – Sentiment
https://cran.r-project.org/src/contrib/Archive/sentiment/
Ota kirjastot käyttöön ja käynnistä R palvelu (run.Rserve)
Yhdistä Tableau ja R (Manage R Connection)
Luo Tableaussa uusi laskennallinen kenttä • SCRIPT_STR('classify_polarity(.arg1,algorith
m="bayes", verbose=TRUE)[,4]',ATTR([Text]))
Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/
Verkostoanalyysi
Social Network Analysis (SNA)
Solmut, yhteydet ja verkostot
Tähti
Ympyrä
Ketju
Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille
Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen
Löyhempi kuin tähti, mutta keskittyneempi kuin ympyrä
0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0
0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0
0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0
18/6
Verkostojen anatomia
Keskeisempiä käsitteitä liittyen verkostoanalyysiin
19
KESKEISYYS ARVOSTUS
TÄRKEYS
Lähde: Wasserman & Faust 1994
Keskeisyysaste Läheisyys Degree Prestige
Proximity Prestige
Välillisyys Informaation keskeisyys
Status or Rank Prestige
• Keskeisyysaste (degree) • Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin
toimijoihin
• Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree)
• Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.
20
Keskeisyysaste (asteluku)
Lähde: Wasserman & Faust 1994
• Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa
• Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin
• dij on lyhyimmän polun pituus i:n ja j:n välillä
• Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä
∑=
=n
ijiji dc
Läheisyys
Lähde: Wasserman & Faust 1994
• Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu
• Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat)
• Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri
22
Välillisyys
Lähde: Wasserman & Faust 1994
Viikkoharjoitus 3: Tee-se-itse Twitter verkostoanalyysi – markkinoinnin näkökulmasta • Asenna seuraavat ohjelmistot
– Anaconda Python 2.7 https://www.continuum.io/downloads
– Gephi https://gephi.org/ • Kerää data
– Tätä varten tarvii luoda Twitter sovellus (App) https://apps.twitter.com/
– Nouda twiitit käyttäen seuraavaa skriptiä https://github.com/jukkahuhtamaki/pcm-demo/tree/master/twitter-api
Hyödynnetään #ohsiha oppeja ja työkaluja
Ohjelmallinen sisällönhallinta 2016
Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016
Valitse itselle/ryhmälle mieleinen firma/organisaatio
Muokkaa Python koodia Spyderillä ja aja se
Avaa gexf (Graph Exchange XML Format) tiedosto Gephillä
Laske verkostometriikat ja visualisoi verkosto
Kiitokset
• Jukka Huhtamäki @jnkka #ohsiha • Harri Jalonen @Jalonen #nemohanke • Jayesh Gupta @jyshgupta