View
1.185
Download
2
Category
Preview:
DESCRIPTION
Presentation given at Karl-Franzens-University.
Citation preview
Konferenz-Tweets:
Ansätze zur Analyse wissenschaftlicher
Kommunikation bei Twitter
Dr. Katrin Weller, M.A.
Vortrag an der Karl-Franzens-Universität Graz
09. Mai 2011
Fragestellung 1
Wie kann wissenschaftliche
Kommunikation bei Twitter
vermessen werden?
Fragestellung 2
Wie twittern
Wissenschaftler während
Fach-Konferenzen?
Microblogging mit Twitter
Max. 140
Zeichen Follower
Hash-tags #
Retweets (RT)
direct messag
e
@-messages
Retweet (RT)
@-message
Hashtag
Einsatzbereiche von Twitter / Untersuchungsszenarien
Wissensmanagement & Unternehmenskommunikation
Naturereignisse & Katastrophen
Wahlen & Politik Werbung & Marketing
Einsatzbereiche von Twitter / Untersuchungsszenarien
Wahlen & Politik
Kanada #iranElection #EkitiElection NRW-Wahl #egypt
Einsatzbereiche von Twitter / Untersuchungsszenarien
Naturereignisse & Katastrophen
#qldfloods red river Oklahoma grass fire
#SoCal Japan
Microblogging in der Wissenschaft?
Wissenschaft & Lehre
Microblogging in der Wissenschaft?
Wie lassen sich wissenschaftliche Tweets erkennen?
Inhaltsbezogen
• Was sind wissenschaftliche Inhalte bei Twitter?
• Automatische Identifikation nicht möglich.
Personenbezogen
• Was ist ein Wissenschaftler?
• Wie findet man diese bei Twitter?
Formatbezogen
• Identifikation über Hashtags.
• Verlust muss in Kauf genommen werden.
Forschungsstand
• Untersuchungen zu Twitter in der Wissenschaft sind
i.d.R. auf Hashtags aufgebaut, insbesondere eignen
sich Konferenzhashtags.
Foto:
http://www.zephoria.org/thoughts/archives/2009/11/24/spectacle_at_we.html
TweetDeck
Twitter-Nutzung bei Konferenzen
Es beteiligen sich Konferenzteilnehmer und Externe an Konferenz-Hashtag-Diskussionen.
Getwittert wird vor, während und nach der Konferenz.
Kostenloses W-Lan und offizielle Konferenz-Hashtags sind nicht immer verfügbar.
Vorgehensweise: Konferenz-Tweets auswerten
• Auswahl der Konferenzen
• Sammlung der Tweets anhand von Konferenzhashtags (über www.twapperkeeper.com)
Datensammlung
• z.B.
• Zeitverläufe
• Aktive Nutzer
• Nutzer-Netze
Automatische Auswertung
• Beurteilung von Tweet-Arten
• Kernfrage: beziehen sich Tweets auf fachliche Inhalte der Konferenz?
• Verweise auf externe Web-Inhalte
Manuelle Auswertung
Auswahl der Konferenzen
Konferenz World Wide
Web
Conference
Dublin Core
and
Metadata
Conference
Modern
Language
Association
Tagung d.
Institute for
Enabling Geo-
spatial
Scholarship
Hashtag #www2010 #dcmi2009 #mla09 #geoinst
Ort Raleigh,
NC, USA
Seoul,
Südkorea
Philadelphia,
PA, USA
Charlottesville,
VA, USA
Konferenz-
daten
26.-
30.04.2010
12. -
16.10.2009
27. -
30.12.2009
25. -
27.05.2010
Fachbereich Informatik Informatik (Digital)
Humanities
Digital
Humanities
Teilnehmer >1.000 < 500 > 1.000 < 500
Untersuchungs-
zeitraum
13.04.-
14.05.2010
12.10.-
23.10.2009
15.12.2009-
14.01.2010
11.05.-
09.06.2010
Basisdaten der Konferenzen
Konferenz #www2010 #dcmi2009 #mla09 #geoinst
Tweet-Anzahl 3.358 146 1.929 1.673
Anzahl der
Twitterer
903 27 369 99
Ø Tweets pro
Twitterer
3,72 5,41 5,23 16,90
Anzahl/Anteil RTs* 33,38%
1121/3.358
25,34%
37/146
21,41%
413/1.929
8,31%
139/1.673
Ø RTs* pro
Twitterer
1,24 1,37 1,12 1,40
Anteil/Anzahl
@-Nachrichten
7,47%
251/3.358
5,48%
8/146
13,37%
258/1.929
24,33%
407/1.673
Ø @-Nachrichten
pro Twitterer
0,28 0,30 0,70 4,11
* Automatisch erkannte RTs.
Automatische Auswertungen
Beispiel für einen Zeitverlauf: #mla09
Zeitachse: Messung in Stunden
An
za
hl d
er T
we
ets
pro
Stu
nd
e
Graphik von Cornelius Puschmann
Beispiel für ein Personennetzwerk basierend
auf RTs: #mla09
Graphik von Cornelius Puschmann
Beispiel für Retweet-Netze im Zeitverlauf
Daten für die Digital Humanities Conference 2010 (7-10 July 2010), Quelle: Puschmann, C., Weller, K., & Dröge, E. (2011). Studying
Twitter conversations as (dynamic) graphs: visualization and structural comparison. Presented at General Online Research, 14-16 March 2011, Düsseldorf, Germany. Retrieved from http://ynada.com/posters/gor11.pdf.
Beispiel für Personeninformationen: #www2010
Aktivität einzelner Personen: Tweetanzahl (#www2010)
@boraz als „Liveticker“
• Bekam dadurch insgesamt viele Retweets, obwohl jeder einzelne Tweet nicht so häufig weiterverbreitet wurde.
• Hat am meisten getwittert.
0
20
40
60
80
100
120
140
160
180
200
Bo
raZ
futu
rew
eb
20
10
fab
ien
_g
and
on
olg
ag
tom
myh
sm
allj
on
es
apis
anty
LaT
err
ible
Liz
ww
w2
01
0 +
WW
W2
010
UN
Cp
ub
lich
ealth
ka
ren
ch
urc
h
neu
ma
rcx
jua
nseq
ued
a
wayn
esutt
on
ma
mun
d
gae
dke
ke
gill
rtro
ncy
ke
vin
ma
rks
alis
oha
ni
lysan
der0
7
hasta
c (
HA
ST
AC
? 1
6)
mu
nm
un
10
the
Ra
b
fra
nkolk
en
mstr
oh
m
xe
eliz
Ya
ho
oLa
bs
JA
NN
AQ
ed8
0
Ima
gin
eIn
tern
et
jah
end
ler
se
core
se
arc
h
ste
ve
da
ve
_l
aam
on
nz
aspyke
r
azaro
th4
2
stu
wrig
ley
tad
ejta
dej
w3cb
rasil
cla
uw
a
josh
sh
kri
sztian
balo
g
ma
ttro
wesh
ow
ale
boz
nitya
Rob
Ve
sse
tam
ing
data
tksa
ka
ki
jun
szh
ao
ruby
Je
niT
Loca
lTe
chW
ire
ma
ntr
uc
va
gn
erd
iniz
An
zah
l Tw
eets
Beispiel für Personeninformationen: #mla09
Aktivität einzelner Personen: Tweetanzahl (#mla09)
Trotz Abwesenheit: Croxall als drittaktivster Twitterer
0
20
40
60
80
100
120
140
160
sa
mp
lere
alit
y
mla
co
nven
tio
n
bri
an
cro
xa
ll
kfitz
ML
Ad
eco
nven
tio
n
trip
roft
ri
am
an
da
fre
nch
jcm
elo
ni
no
wvis
kie
aca
de
mic
da
ve
New
Fa
cM
ajo
rity
Je
nH
ow
ard
rya
nco
rde
ll
am
an
da
lica
str
o
wpw
en
d4
2
am
nd
w2
ge
org
eo
nlin
e
ee
tem
ple
ton
mkir
sch
en
ba
um
sp
ike
nlil
li
an
ne
cm
cca
rth
y
eri
cg
and
ers
on
warn
ick
alo
ge
ma
nn
de
rekb
ruff
ch
risty
de
na
EM
iC_
pro
ject
pro
fsyn
kw
isso
ke
r
lizlo
sh
min
i_m
ia
mkg
old
An
zah
l Tw
eets
Personeninformationen: Beispiel #mla09
Aktivität einzelner Personen: @-Nachrichten (#mla09)
Beispiel: Brian Croxalls Abwesenheit
• Croxall konnte nicht an der Konferenz teilnehmen.
• Verfasste dazu einen Kommentar, der für viel Resonanz auf Twitter sorgte.
05
10152025303540
An
zah
l @
-Nach
rich
ten
@-Nachrichten gesendet @-Nachrichten empfangen
Manuelle Auswertung
Manuelle Auswertung: Tweets
Kategorisierungsschema für Tweet-Inhalte
1. Ebene: Inhalt
1.1 Bezug auf fachliche Themen der Konferenz [YES]
1.2 Kein Bezug auf fachliche Themen der Konferenz [NO]
1.3 Nicht definierbar [NA]
2. Ebene: Zweck
2.1 Kommunikation, Kontakt zu anderen [COM]
2.2 Konferenzbezogene Tweets [CONF]
2.3 Selbstbezogene Tweets [ME]
2.4 Retweets [RT] (nicht weiter kategorisiert)
2.5 Externe Links [URL]
2.6 Nicht definierbar [NA]
Kategorisierungsbeispiele (1. Ebene)
“#www2010 by Danah Boyd on "Privacy and
Publicity in the Context of Big Data",
http://www.danah.org/
papers/talks/2010/WWW2010.html”
“Anyone form UNC North Carolina here
today? what about lunch together tomorrow at
Convetion Center? (Alumni MA1994, Poli
Scie) #www2010”
“Good luck to all the TW people at #www2010
and #websci2010”
Kategorisierungsbeispiele (2. Ebene)
“the 'official' tag for Dublin Core conference in
Seoul is now #dcmi2009”
“managed to change my flights. let's hope the
cloud doesn't stand in the way now... #www2010
#w4a #ashtag”
“Very good summary! RT @pgroth: blog post up:
two themes from #www2010 -
http://wp.me/pm8cF-3c”
Erste Ergebnisse
308
953
1.002
938 105
155
0
500
1000
1500
2000
2500
#mla09 #www2010
An
teil
an
de
n K
on
fere
nz
-Tw
ee
ts
(oh
ne
RT
s)
Beziehen sich die Tweets auf fachliche Inhalte der
Konferenz? (ohne RTs)
keine Angabe Nein Ja
Erste Ergebnisse
0
50
100
150
200
250
300
350
400
An
za
hl
de
r T
we
ets
(#
mla
09
)
Welche Arten von Tweets beziehen sich auf fachliche Inhalte der Konferenz? (#mla09)
Fachlicher Bezug nicht beurteilbar
Kein fachlicher Bezug vorhanden
Fachlicher Bezug vorhanden
(ohne r
ein
e R
Ts,
ohne f
rem
dsp
rachlic
he T
weets
)
Erste Ergebnisse
0
100
200
300
400
500
600
700
An
za
hl
de
r T
we
ets
(#
ww
w2
01
0)
Welche Arten von Tweets beziehen sich auf fachliche Inhalte der Konferenz? (#www2010)
Fachlicher Bezug nicht beurteilbar
Kein fachlicher Bezug vorhanden
Fachlicher Bezug vorhanden
(ohne r
ein
e R
Ts,
ohne f
rem
dsp
rachlic
he T
weets
)
Erste Ergebnisse
53,8
30,9
21 17,8
5
27
15,5
31 27,3
15,4
0
10
20
30
40
50
60
CONF URL COM ME NA
An
teil
an
den
Tw
eets
ein
er
Ko
nfe
ren
z
(oh
ne R
etw
eets
) in
%
Welchem Anteil der gesamten Tweets einer Konferenz wurden
die folgenden Kategorien zugewiesen? (Vergabe von mehreren Kategorien pro Tweet möglich)
#www2010
#mla09
%
%
%
% %
%
%
%
101
10
98
38
2
%
%
63
0
22
0
42
8
43
9
36
4
38
6
21
8
Zitationsanalyse bei Twitter
Zitationen und Referenzen
• Dokument A zitiert Dokument B = es enthält eine Referenz auf B..
• Es fließen Informationen von B nach A.
• Dokument B erhält eine Zitation und damit Reputation.
Zitierendes
Dokument A Zitiertes
Dokument B Reputation
Information Referenz: siehe M.
Muster. In: Dokument
B., S. 55.
Deshalb sage ich:
alles wird gut!
Zitat: „[…] alles wird
gut!“
Zitationen und Referenzen in Twitter?
URLs im Tweet
• Referenzen nach außen („external citations“)
• Worauf wird verwiesen?
Retweets
• Zitationen – Referenzen („internal citations“)
• Fehlende Standardisierung
@-mentions
• „Just read an interesting paper by @sampleuser”
• Schwer zu identifizieren
URLs im Tweet
#www2010 #mla09
Number (and %) of tweets
including at least one URL
1,338 (39.85%)
525 (27.22%)
Number of total URLs 1,460 551
Number of unique URLs 574 199
Verschiedene Zählweisen sind möglich
Häufigkeiten von URLs: #www2010
0
5
10
15
20
25
30
35
40
45
1
31
61
91
12
1
15
1
18
1
21
1
24
1
27
1
30
1
33
1
36
1
39
1
42
1
45
1
48
1
51
1
54
1
Fre
qu
en
cy o
f U
RL
on
ra
nk
n
URL on rank n (ranked by frequency)
Distribution of URLs from #www2010
#www2010
Häufigkeiten von URLs: #mla09
0
5
10
15
20
25
30
1 9
17
25
33
41
49
57
65
73
81
89
97
10
5
11
3
12
1
12
9
13
7
14
5
15
3
16
1
16
9
17
7
18
5
Fre
qu
en
cy o
f U
RL
on
ra
nk
n
URL on rank n (ranked by frequency)
Distribution of URLs from #mla09
#mla09
URL Kategorisierung
Blog Conference Error Media
Press Project Publication Slides
Twitter Other
Häufige URLs mit Kategorien: #www2010
URL Frequency Category
http://blog.marcua.net/post/566480920/twitter-papers-at-
the-www-2010-conference
41 Blog
http://www.danah.org/papers/talks/2010/WWW2010.html 35 Publication
http://kmi.tugraz.at/staff/markus/www2010/www2010_roo
mstream.html
29 Twitter
http://xquery.pbworks.com/rtp-meetup 22 Error
http://www.elon.edu/e-
web/predictions/futureweb2010/carl_mala
mud_www_keynote.xhtml
22 Conference
http://www.elon.edu/e-
web/predictions/futureweb2010/default .xhtml
18 Conference
http://futureweb2010.wordpress.com/schedule/ 16 Conference
http://www.slideshare.net/haewoon/what-is-twitter-a-
social-network-or-a-news-media-3922095
13 Slides
http://events.linkeddata.org/ldow2010/ 12 Conference
http://opengraphprotocol.org/ 12 Project
http://www.websci10.org/program.html 12 Conference
Häufige URLs mit Kategorien: #mla09
URL Frequency Category
http://amandafrench.net/2009/12/30/make-10-louder/ 27 Blog
http://www.briancroxall.net/2009/12/28/the-absent-presence-
todays-faculty/
23 Blog
http://nowviskie.org/2009/monopolies-of-invention/ 22 Blog
http://chronicle.com/article/missing-in-action-at/63276/ 20 Error
http://www.profhacker.com/?p=4448 18 Press
http://www.samplereality.com/2009/11/15/digital-humanities-
sessions-at-the-2009-mla/
18 Blog
http://chronicle.com/blogpost/the-mlathe-digital/19468/ 16 Press
http://www.profhacker.com/2010/01/09/academics-and-
social-media-mla09-and-twitter/
15 Press
http://academhack.outsidethetext.com/home/2010/the-mla-
briancroxall-and-the-non-rise-of-the-digital-humanities/
15 Blog
http://www.samplereality.com/2010/01/02/the-mla-in-tweets/ 15 Blog
Analyse der URL Kategorien: #mla09 und #www2010
Blog; 229
Conference; 23
Error; 69
Media; 34
Press; 123
Project; 11
Publication; 4
Slides; 0
Twitter; 22 Other; 36
Categories of URLs from #mla09 (counting all URLs, n=551)
Blog; 54
Conference; 16
Error; 28
Media; 25
Press; 34 Project; 5
Publication; 3
Slides; 0
Twitter; 14 Other; 20
Categories of URLs from #mla09 (counting unique URLs only, n=199)
Blog; 68
Conference; 37
Error; 92
Media; 71
Press; 33 Project; 51
Publication; 52
Slides; 45
Twitter; 31
Other; 94
Categories of URLs from #www2010 (counting unique URLs only, n=574)
Blog; 222
Conference; 206
Error; 201
Media; 137 Press; 92
Project; 116
Publication; 135
Slides; 106
Twitter; 76
Other; 169
Categories of URLs from #www2010 (counting all URLs, n=1460)
Retweets
#www2010 #mla09
Automatically detected RTs: Number and
percentage of RTs in entire conference
dataset
1,121 (33.38% of
3,358)
414 (21.46% of
1,929)
∅ RTs per twitterer (automatically detected
RTs, entire conference dataset)
1.24 1.12
Retweets including at least one URL 530 207
Manually detected RTs: Number and
percentage of RTs in entire conference
dataset
1,318 (39.25% of
3,358)
514 (26.65% of
1,929)
Manually detected RTs: Number and
percentage of retweets in subdataset of
tweets during actual conference days
828 (34.13% of
2,426)
269 (30.6% of 1,206)
Verschiedene Zählweisen
Probleme bei der Auswertung
RT@kwelle RT @rene_kaiser RT @MartineDurrant:
How 20 popular websites looked when they launched -
Telegraph http://tinyurl.com/mray5q
Verschachtelte Retweets („encapsulated retweets“)
Format RT@user ist nicht die einzige Möglichkeit:
• via@user
• Nur Text ohne Verfasser
Retweets nach Personen
#www2010
RTs given
#www2010
RTs received
#mla09
RTs given
#mla09
RTs received
laterribleliz (46) boraz (85) newfacmajority (25) samplereality (49)
uncpublichealth (42) apisanty (61) ryancordell (20) briancroxall (35)
olgag (30) futureweb2010 (51) jcmeloni (13) nowviskie (33)
Top 3 der viel-zitierten und viel-zitierenden Twitterer
Retweet-Verteilung: #www2010
0
10
20
30
40
50
60
70
80
90
1 51 101 151 201 251 301 351 401 451 501 551
nu
mb
er
of
RT
s r
ec
ieve
d f
or
or
giv
en
by
pe
rso
n o
n r
an
k n
person on rank n
Distribution of given and received retweets for #www2010
RTs received
RTs given
Retweet-Verteilung: #mla09
0
10
20
30
40
50
60
1 21 41 61 81 101 121 141 161 181
nu
mb
er
of
RT
s r
ec
ieve
d f
or
or
giv
en
by
pe
rso
n o
n r
an
k n
person on rank n
Distribution of given and received retweets for #mla09
RTs received
RTs given
Viel-zitierte Tweets: #www2010
Tweet text and ID From User RTs
a delegação brasileira presente na #www2010 acaba de
receber a notícia: a cidade do Rio de Janeiro sediará a
Conferência #WWW2013 (ID: 13206448810)
w3cbrasil 24
twitter roomstreams for every conference room at #www2010
can be found at http://bit.ly/bRfE69 #302C (ID: 12881760468)
mstrohm 16
Summary of Twitter papers presented at #www2010
http://is.gd/bRqBF (ID: 13268676873)
alisohani 11
Viel-zitierte Tweets: #mla09
Tweet text and ID From User RTs
Hey, guys, I've blogged about "the
amplification of scholarly communication":
Twitter, #MLA09, @briancroxall, & such:
http://bit.ly/7SRgqZ (ID: 7221520139)
amandafrench 18
New at ProfHacker: “Academics and Social
Media: #mla09 and Twitter,” by
@GeorgeOnline (and a bunch of you):
http://wp.me/pAGUw-19K (ID: 7566711357)
profhacker 17
"Monopolies of Invention:" text of my #MLA09
talk on labor & IP issues in humanities
collaboration: http://is.gd/5Gckz (ID:
7185970970)
nowviskie 16
URL No. 1
URL No. 5
URL No. 3
Fazit
Erste Erkenntnisse zum Twitter-Verhalten auf wissenschaftlichen
Konferenzen.
• Twitter dient nicht ausschließlich (und nicht vorwiegend) zur Fach-
Diskussion.
• Unterschiedliche Verhaltensmuster bei verschiedenen Konferenzen.
• Meist hohe Anteile an RTs und Verweise auf URLs.
Verfeinerung und Ausweitung der Analysemethoden ist notwendig.
Vergleiche mit Twitterdaten aus anderen Anwendungsbereichen
geplant.
Diskussion erwünscht!
Ausblick / Fortsetzung
Work in Progress:
• Überarbeitung des Kategorisierungsschemas
• Auswertung von Tweets für als Wissenschaftler identifizierte
Personen
Mögliche weitere Forschungsbereiche:
• Identifikation von „Nutzertypen“, Netzwerkanalyse
• Analyse weiterer Konferenzen (verschiedene Fachbereiche)
• Untersuchung zusätzlicher Hashtags pro Konferenz
• Einbeziehung von Hintergrundinformationen
Beste Grüße aus Düsseldorf!
Beste Grüße aus Düsseldorf!
Dr. Katrin Weller Abteilung für Informationswissenschaft
Institut für Sprache und Information
Heinrich-Heine-Universität Düsseldorf
Universitätsstr. 1, Geb. 23.21.04.68, 40225 Düsseldorf
E-Mail: weller@uni-duesseldorf.de
Twitter: @kwelle
Vielen Dank an die Kollegen:
@coffee001
Cornelius Puschmann
@free5pirit
Julia Verbina
@knuurps
Evelyn Dröge
@ParrPar
Parinaz Maghferat
#iwhhu #nfgwin
Literatur (Auszüge)
• Boyd, D., Golder, S., Lotan, G.: Tweet, tweet, retweet: Conversational aspects of retweeting on Twitter. In R. H.
Sprague (Ed.), Proceedings of the 43rd Conference on System Sciences (HICSS 10), Honolulu, Hawaii, USA.
Piscataway, NJ: IEEE (2010)
• Dröge, E., Maghferat, P., Puschmann, C., Verbina, J., & Weller, K. (2011). Konferenz-Tweets: Ein Ansatz zur
Analyse der Twitter-Kommunikation bei wissenschaftlichen Konferenzen. In Proceedings of ISI 2011: Internationales
Symposium der Informationswissenschaft 2011, Hildesheim, Germany.
• Ebner, M., & Reinhardt, W. (2009). Social networking in scientific conferences: Twitter as tool for strengthen a
scientific community. In U. Cress; V. Dimitrova, & M. Specht (Eds.), Learning in the Synergy of Multiple
Disciplines.4th European Conference on Technology Enhanced Learning, EC-TEL 2009 Nice, France. Berlin:
Springer.
• Letierce, J., Passant, A., Decker, S., & Breslin, J. G. (2010). Understanding how Twitter is used to spread scientific
messages. In Proceedings of the Web Science Conference (WebSci10): Extending the Frontiers of Society On-Line,
Raleigh, NC, USA.
• Priem, J., & Costello, K. L. (2010). How and why scholars cite on Twitter. In C. Marshall; E. Toms, & A. Grove (Eds.),
Proceedings of the 73rd ASIS&T Annual Meeting on Navigating Streams in an Information Ecosystem, Pittsburgh,
PA, USA (pp. Article No. 75). New York, NY: ACM.
• Puschmann, C., Weller, K., & Dröge, E. (2011). Studying Twitter conversations as (dynamic) graphs: Visualization
and structural comparison. Poster presented at General Online Research (GOR 11), 14-16 March 2011, Düsseldorf,
Germany. Retrieved from http://ynada.com/posters/gor11.pdf.
• Ross, C., Terras, M., Warwick, C., & Welsh, A. (2011). Enabled backchannel: Conference Twitter use by digital
humanists. Journal of Documentation, 67(2), 214–237.
• Weller, K., Dröge, E., & Puschmann, C. (2011, to appear). Citation Analysis in Twitter. Approaches for Defining and
Measuring Information Flows within Tweets during Scientific Conferences. In Proceedings of the Making Sense of
Microposts Workshop (#MSM2011) at the Extended Semantic Web Conference (ESWC 2011), Crete, Greece.
Recommended