Upload
universitetet-i-tromso
View
1.436
Download
6
Embed Size (px)
DESCRIPTION
Å sjå Wikipedia som sosialt nettverk og kvalitets(u)sikra leksikon fangar opp berre delar av Wikipedia. Forelesinga vil ta opp sentrale delar av Wikipediaforskinga, med vekt på forsøka på å forstå Wikipedia som strukturering av menneskeleg kunnskap. Sett i dette lyset blir forsøket på å forstå Wikipedia også ein veg til forståinga av den menneskelege kunnskapen i seg sjølv
Citation preview
Forstår vi Wikipedia no?
Forstår vi Wikipedia no?
Trond TrosterudSenter for samisk språkteknologi
Institutt for språkvitskapUniversitetet i Tromsø
Foredrag på Wikipedia Academy i Bergen 15.10. 2009
Forstår vi Wikipedia no?
Innhald
WP i offentleg norsk debattKritikkenKunnskapssynet bak kritikkenRelavansen av kritikken
WikipediaforskingForsking på Wikipedia sitt innhaldForsking på sammfunnsmessige aspekt knytt til WikipediaForsking på teknologiske aspekt ved Wikipedia
Vurdering av Wikipedia
Samlivet framover: Wikipedia og Akademia
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Kritikken
Kritikken mot WP frå akademia og presse i Noreg
I Delvis går kritikken på at kven som helst kan skrive anonymtpå Wikipedia
I Wikipedia har ikkje signerte artiklarI ==> og det er dermed umogleg å finne ut kven som har
skrive deiI Ein annan kritikk legg vekt på manglande redaksjon
I WP er upåliteleg, på grunn av mangel på kontrollI ==> WP kan ikkje bli brukt som kjelde
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Kritikken
Problematiske sider med kritikken
I Denne kritikken forstår ikkje korleis Wikipedia fungererI Artiklane er ikkje signert, men kvar artikkel har ein
versjonshistorikk, der forfattaren attom kvar einaste redigeringkan identifiserast, via fullt namn, brukarnamn eller IP-nummer
I Kritikken vitnar om eit snevert kunnskapssynI Faktakunnskap er berre ein liten del av det WP kan bidra med
I Nokre av dei mest synlege kritikarane har dessutaneigeninteresse i konkurrerande leksika eller smuldrandekunnskapsmonopol
I (For all del: Det finst også ting å kritisere! — det kjem egattende til)
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Kunnskapssynet bak kritikken
Kunnskapssynet bak kritikken om faktafeil
I 42I er talet som superdatamaskinen Deep Thought reknar ut at er
svaret på det store spørsmålet om meininga med livet,universet og alt (Douglas Adams: The hitchhiker’s guide to thegalaxy)
I Det kritikarane er redd for er altså at nokon skal snike seg inn,og erstatte 42 med 41.
I I ein by som er i stand til å gje Julia Kristeva Holbergprisenbør vi vere i stand til å sjå at noko er gale her
I Bergens Tidendes faktasjekk.no er eit godt døme på detproblematiske ved dette kunnskapssynet (dei laga ein storfaktasjekk av Lundteigens «Verdiskaping skjer ikkje i Oslo»...
I men sanningsgehalten av utsegnet er avhengig av definisjonenav ordet verdiskaping !!)
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Kunnskapssynet bak kritikken
Det viktige er å forstå
I Her er nokre spørsmål eg har stilt til WP:I Korleis fungerer ein hmm-parsar?I Korleis relaterer dei ulike parsarane for norsk seg til
Chomsky-hierarkiet?I Kva er statusen til aragonesisk, og kvar finn eg dei relevante
standardiseringsorgana for dette språket?
I Sanningskriteriet her er ikkje 42 eller ikkje, men om eg, etter åha lese artikkelen, er i stand til å forstå dei tekstane eg les, deiforedraga eg skriv
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet er ikkje «kan vi stole på WP?»I Faktaopplysningar (lister og detaljkunnskap) er WP si sterke
sideI Rutinene for å oppdatere, kontrollere, og synkronisere
faktaopplysningar blir betre år for årI Alle studier av vandalisme på WP viser at det blir fjerna fortI Kritikarar må ty til juks for å finne faktafeil
I Go’ Morgen Danmarks Wiki-gate, der kritikarane sjølv haddefabrikert feil fødselsår på programleiaren, feilen vart retta avdansk WP i løpet av eit par minutt, og kritikarane måtte viseeit manipulert bilete av sida)
I Studier av feilretting der forskaren sjølv har planta feila på WPer metodologisk feil
I feil bevisst planta av journalistar og «forskarar» skil segsystematisk frå autentiske feil
I Forsking på autentiske feil er (som all ekte forsking) hardtarbeid : forskaren må finne feila, og ikkje fabrikere data
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet er ikkje «WP eller Store Norske Leksikon»
Spør skoleelevar om kva kjelder dei bruker. Dei svarer, i nummerertrekkjefølgje:
1. Wikipedia2. Google3. Skolebøker
Dei har som regel ikkje hørt om Store Norske, og i tilfelle berre ompapirversjonen, fordi vaksne har vist dei at den finst.
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet for forskaren kan sjølvsagt vere «skal eg skrivepopulærvitskapleg på WP eller i ein kronikk i BergensTidende»
I Kronikken blir lese av alle (dvs. alle som les kronikkar) i dagI ... men er gløymt i morgonI og sjølv om du finn kronikken att inngår han ikkje i ei
systematisk kunnskapsformidling, slik som ein WP-artikkel gjer
I Det vi presenterer på WP blir ståande, og vil framleis veretilgjengeleg
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Paradokset om forskingsformidling
I Viss forskingsformidling skal vere underhaldning for lekfolk somvil bli amusert, kan det godt vere kronikk i avisa (artig i dag,borte i morgon)
I Men viss forskingsformidling skal vere nyttig for lekfolk som erseriøst interessert i faget må det stå på WP (systematiskpresentert, tilgjengeleg også i morgon)
I Paradokset er at dei som klager over at WP ikkje er seriøs noksamtidig er dei som går inn for den useriøseforskingsformidlinga
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet er ikkje «vil eg skrive på WP eller ikkje?»
Det er ikkje i kor stor grad eg liker WP som er relevant herSpørsmålet akademikarar må stille seg er:er stoffet mitt synleg for lekfolk?... som er det same som: er stoffet mitt på WP?
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet handlar ikkje om artikkelskriving i det heile!!
I Spørsmålet er ikkje om «akademikarar skal skrive artiklar».I På WP skriv vi ikkje artiklarI Vi skriv på artiklarI Kollektiv skriv artiklar.I Alle artiklane Bergenstidsskriftet Vox Publica fekk
akademikarar til å skrive og deretter la ut på WIkipedia vartumiddelbart langt betre av å bli lagt ut i det offentlegerommet.
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Spørsmålet kan vere «kva språkversjon skal eg skrive på?»
I Nordmenn flest kan lese minst 6 ulike WP, og skrive påhalvparten av dei
I Det språklege mangfaldet har ein verdi ut over det reintspråklege
I Mange les den engelske utgåvaI Det dei mistar er det norske perspektivet
I Gledeleg for meg: Nettstatistikk viser at nynorsk WP ofte harlike god lesarstatistikk som bokmåls-WP
Forstår vi Wikipedia no?
WP i offentleg norsk debatt
Relavansen av kritikken
Dei ulike språkversjonane representerer ulike fortolkingar avverda
I Engelsk:I God på dataartiklar, matematikk, trivialkulturI Men: ofte for lange, ustrukturerte artiklar, særleg biografiar
I TyskI Mindre småprat enn på engelskI Betre strukturert, mindre fyll mellom kvart gullkornI Eit europeisk perspektiv
I Nynorsk vs. bokmålI Ofte kortare nn-artikkel — det er slett ikkje alltid negativtI Nynorsk har sine sterke sider (språk, Vestlandet,
ekkokardiografi...) — men er dårleg på trivia og sport
I For alle språkversjonar gjeld det at WP speglar kva som erviktig for det språksamfunnet
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking
Vi kan klassifisere WP-forskinga i tre hovudtypar:
1. Forsking på Wikipedia sitt innhald2. Forsking på samfunnsmessige aspekt knytt til Wikipedia3. Forsking på teknologiske aspekt ved Wikipedia
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
Forsking på Wikipedia sitt innhald
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
WP som kjelde for språkteknologar
I fritt tilgjengeleg tekst på mange språkI ... arbeidet vårt med komi...
I parallelle tekstar, i laus forstandI interwikilenkjer som potensielle ordbøker og namnebaserI kategoriane (semantisk framstilling av kategoriar)I kategoriar som semantiske strukturar - sett, over- og
underordning, osb.I kvar artikkel sin vektor, klassifisering av nye konsept etter kor
nær dei er dei ulike vektorane, og dermed kategoriane deira
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
Tabell: 847 av 16500 artiklar på aclweb.org etter 1965 viser til WikipediaLarge-Scale Named Entity Disambiguation Based on Wikipedia DataOutclassing Wikipedia in Open-Domain Information Extraction ...Topic Identification Using Wikipedia Graph CentralityConstruction of Disambiguated Folksonomy Ontologies Using WikipediaNamed Entity Recognition in WikipediaAn Unsupervised Approach to Biography Production Using WikipediaExtracting World and Linguistic Knowledge from WikipediaMining Wikipedia Revision Histories for Improving Sentence CompressionA Resource-Poor Approach for Linking Ontology Classes to Wikipedia ...Hacking Wikipedia for Hyponymy Relation AcquisitionAnalysing Wikipedia and Gold-Standard Corpora for NER TrainingWikiWalk: Random walks on Wikipedia for Semantic RelatednessSummarizing Definition from WikipediaEvaluating a Statistical CCG Parser on WikipediaWikipedia as Frame Information RepositoryAutomatically Generating Wikipedia Articles: A Structure-Aware ...Cross-lingual Alignment and Completion of Wikipedia TemplatesAutomatic Content-Based Categorization of Wikipedia ArticlesFinding Hedges by Chasing Weasels: Hedge Detection Using Wikipedia ...Proceedings of the Joint Conference of the 47th Annual Meeting of ...Extracting Lexical Reference Rules from WikipediaThe QuALiM Question Answering Demo: Supplementing Answers with ...Directions for Exploiting Asymmetries in Multilingual WikipediaA Novel Approach to Automatic Gazetteer Generation using WikipediaProceedings of the 45th Annual Meeting of the Association of ...Exploiting Wikipedia as External Knowledge for Named Entity ...An analysis of Wikipedia digital writingA Graph-Based Approach to Named Entity Categorization in Wikipedia ...Unsupervised Relation Extraction by Mining Wikipedia Texts Using ...
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
WP som tekst for tekstforskarar
I WP som språksamfunnets fortolking av verdaI ... i 200 ulike versjonar
I Vi kan ta ut ulike delar av tekstrommet og sjå på deiI Versjonshistorikken gjer det mogleg å studere den redaksjonelle
prosessen attom tekstproduksjon
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
WP for informatikarar
I WP er kjeldetekst for forsking på maskinlæring og søkemotorarI WP er også ei potensiell kjelde for forsking på komplekse
system
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
WP for dokumentasjonsvitarar
I Wikipedia kan bidra til nye svar på spørsmålet om kva eitdokument er:
I Kan den interne strukturen (synkront og diakront!!) tilWP-dokument generaliserast til andre dokument?
I Kan dokumensamlingene som Wikipedia er bli brukt somnøkkel for prosessering av andre dokumentsamlingar?
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på Wikipedia sitt innhald
WP for framtidas historikarar
I ... som kjelde til forsking på mentalitetshistorie for periodenetter 2001
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
I Fenomenet Wikipedia, korleis var det mogleg?I manglande kontrollinnstans
I Starten på Wikipedia var Nupedia, eit wiki-leksikon med einkontrollinstans som artiklane måtte gjennom før publisering
I Modellen vart repetert på nettutgåva av SNL, med samedårlege resultat
I ikkje krav om innlogging, låg terskel, umiddelbar publiseringI Genuin folkeleg interesse for kunnskap
I Dette var mine tentative svar, vi treng forsking for å forstådesse prosessane betre
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Kva konklusjonar kan vi dra av storleiken på dei ulikeWP-språkversjonane?
I Forhold mellom Ausbau- og Abstand-språk:I normannisk og asturisk er Ausbau-språkI baskisk, grønlandsk, walisisk, nordsamisk er Abstand-språk
I Korfor oppsto norsk i opposisjon til dansk, men ikkje älvdalskai opposisjon til svensk?
I Dette veit vi mykje om (for norsk), men WP kan fortelje ossmeir, for mange fleire språksamfunn
I Dagens WP-flora kan fortelje oss mykje om verdas språkøkologi
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Wikipedias sterkaste kontinent: Europa
Tabell: Wikipedia på ulike språk i Europa
Språkfamilie WP statsberande andre manglar WPSlaviske: 16 13 1-3Germanske 20 7 13Romanske: 28 6 22Uralske: 25 3 4 18Tyrkiske: 5 1 1 3
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Wikipedias sterkaste kontinent: Europa
I Det låge talet på WP-versjonar på ikkjestatsberande slaviskespråk står i slåande kontrast til talet for germansk og særlegfor romansk
I Eit nærare studium av språksamfunna attom desseWP-versjonane kan fortelje oss om ulike europeiske samfunn
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Wikipedia på tidlegare kolonispråkI Afrika
I Ein funksjonell WP på afrikansk språk sør for Sahara:I Swahili — det einaste afrikanske statsspråket (utom amharisk)
med berre ein generasjons engelsk koloniherredømmeI Sameland (6 språk - 1 WP, nordsamisk: 2817 artiklar)
I (Nesten) ingen samar skriv på WPI Innhaldet er stort sett infrastruktur laga av finnar med samisk
som framandspråkI Samar er 3-4-språklege, og treng ikkje samisk WPI Samar over 25 år lærte ikkje å skrive samisk på skolenI Samiske skribentar (språkkonsulentar) skriv for pengar
I GrønlandI Spesielt alvorling tilfelle:I 150 år med morsmålsopplæring, einspråkleg befolkning,
dysfunksjonell WPI Vi vil forstå korfor, og vi vil gjere noko med det
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
WP i ulike språksamfunn
Tabell: Wikipedia articles per population (juli 2007)
Høgaste over 20000 art/m Høgaste under 10000 art/m Lågaste under 10000 art/mNynorsk 48864 Cornish 377429 Punjabi 3Estonian 34507 Norman 130500 Gujarati 7Swedish 26662 Northern Sami 112450 Sinhalese 13Nepal Bhasa 25296 Scottish Gaelic 73600 Pashto 20Bokmål 23947 Irish Gaelic 52230 Nepali 37Slovene 22745 Malagasy 52230 Min Nan 57Finnish 20595 Faroese 31113 Urdu 58Dutch 13846 Kashubian 31040 Cantonese 66Danish 12418 Ripuarian 27436 Tagalog 72Lithuanian 12303 Sanskrit 19350 Lingala 74Slovak 12119 Võro 18714 Tok Pisin 76Polish 8789 Franco-Provençal 17195 Kashmiri 77Hebrew 8599 Asturian 15829 Malayalam 91Galician 7361 Walloon 15237 Sardinian 100Croatian 6623 Corsican 13425 Mongolian 102Czech 6022 West Frisian 12250 Amharic 109Catalan 5706 Tongan 11505 Kannada 118Lombard 5629 Ladino 10418 Swahili 135German 4935 Romansh 5771 Bashkir 175Italian 4616 Divehi 5403 Yoruba 183
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på sammfunnsmessige aspekt knytt til Wikipedia
Wikipedia på norsk
Tabell: Skribentar og artiklar på Wikipedia på nynorsk og bokmål
wikipedant bidrag databasetot nye >5 >100 artikl(t) ord(m)
Aug 09 nn+nb 7970 143 679 106 277 73,5Aug 09 nb 7456 134 626 95 227 62,1Aug 09 nn 514 9 53 11 50 11,4Nyn-% av tot 6,4% 6,3% 7,8% 10,4% 18,1% 15,5%
Forstår vi Wikipedia no?
Wikipediaforsking
Forsking på teknologiske aspekt ved Wikipedia
Forsking på teknologiske aspekt ved Wikipedia
I Interne aspekt: Korleis få Wikipedia til å fungereI manglande kontrollinnstans (Nupedia-feilen)
I Eksterne aspekt:I Kan wikimodellen generaliserast til andre
dokumentasjonsprosjekt?I — ja
I Kan vi få i pose og sekk: Avanserte templat og lågredigeringsterskel?
Forstår vi Wikipedia no?
Vurdering av Wikipedia
Vurdering av Wikipedia
Forstår vi Wikipedia no?
Vurdering av Wikipedia
Vurdering av innhaldet i Wikipedia
I Er så alt bra? Nei.I Ein svak artikkeltype er oversynsartiklar
I Artiklar som krev at skribenten har grep om eit heiltfagområde, og skriv oversynet i ein sveip
I Dette kjem av at akademikarar i for liten grad skriv på WPI Andre svake sider ved WP:
I kausalsamanhengarI fagområde som verken har stor allmenn interesse eller er
naturvitskaplegeI systematikk i måten artiklane refererer til kjeldene sine
I Det verste med WP er det som ikkje står der (alt er ikkjegjort!)
Forstår vi Wikipedia no?
Vurdering av Wikipedia
Vurdering av innhaldet i Wikipedia
I Ulike felt har ulik dekningsgradI Ei undersøking på engelsk WP viser at artiklar om dataprogram
og Harry Potter er betre representert enn artiklar om geriatriI Svaret her er gjerokrati : gjer noko med det sjølv, da vel.
I Geriatrikarane har sove i timen, og dei gamle kan ikkje data
I Poeng: Mangelen på stoff er ikkje WP sitt problem, det er mitt(akademikaren) problem
Forstår vi Wikipedia no?
Vurdering av Wikipedia
Sterke sider ved WP
I WP teksttyper: gode på fakta, lister, detaljkunnskapI WP stoffområde: gode på populærkultur, kuriosa, ITI Redsla for dei maniske sabotørene er overdrive:
I det går som regel bra: få artiklar er sabotert, og det som blirsabotert blir retta
I (WP har ikkje fordommar mot stoffområde)I (jf. Store Norske Leksikon sitt negative syn på grammatiske
opplysningar i språkartiklarr)
Forstår vi Wikipedia no?
Vurdering av Wikipedia
Kva Wikipedia ikkje er
I Det er mange ting WP ikkje er. I denne konteksten kan egnemne:
I WP er ikkje forumet for å presentere original forsking.I Original forsking høyrer heime i fagfellevurderte tidsskrift, og
blir fjerna frå WPI WP er ikkje (erstatning for) pensumlitteratur for
universitetsstudentarI Samanlikna med pensumlitteraturen er WP overflatisk.
Studentar skal lærast av med å bruke WP som einaste kjeldeI WP er ikkje eit sosialt medium
I Folk som skriv mykje på WP blir kjent med kvarandre, påsame måten som folk som arbeider på t.d. eit sjukehus blir det.Men dei møtest for å utføre noko, ikkje for å vere i lag
Forstår vi Wikipedia no?
Samlivet framover: Wikipedia og Akademia
Kva kan Wikipedia gjere for oss forskarar?
I Popularisering av forskingsresultat:I WP kan gjere forskingsresultata våre synlegI Det finst ingen annan publiseringskanal for å nå lekfolk
I WP er ei kjelde til kunnskap for oss (ei blant mangekunnskapskjelder)
I WP kan også inspirere oss til å publisere kjeldematerialet våre(men ikkje på WP; som er eit leksikon)
I Å publisere ikkje berre resultat, men også grunnlagsmateriale,rådata, vil innebere eit stort sprang framover i forsking
Forstår vi Wikipedia no?
Samlivet framover: Wikipedia og Akademia
Kva kan vi forskarar gjere for Wikipedia?
I Vi kan gjere den kollektive menneskelege kunnskapen (vår flikav den) synleg for lekfolk
I For å kunne bruke WP som publiseringskanal må vi innsjå atWikipedia er oss, oss menneske (ja, oss akademikarar også)
I Viss noko manglar, eller noko er skeivt eller skakt på WP, erdet ikkje fordi «Wikipedia ikkje har gjort noko med det»
I «Volkswagen» kan referere både til bilen og til dei menneskasom arbeider der («Volkswagen har no utvikla ein nymodell...»)
I «Wikipedia» er ikkje tvetydig på same måte. Wikipedia er eitnettleksikon, og ei samling datamaskiner i Florida. Ut over deter Wikipedia deg og meg, alle oss som skriv på Wikipedia —eller lar det vere.
Forstår vi Wikipedia no?
Samlivet framover: Wikipedia og Akademia
Norsk Akademia og wikipediaforskinga
I Utfordringa er å forstå potensialet i WikipediaI Først: Forstå Wikipedia, korleis det er bygd opp og fungerer:
I Forskarar er intelligente menneske, og bør kunne trykke på alleknappar på Wikipedia-skjermbiletet
I Deretter: Bruke Wikipedia, på den måten som passar for denrelevante forskingsoppgåva:
I ... som den unike manifestasjonen av fleire og fleire aspekt vedmenneskeleg kunnskap som det er.
Forstår vi Wikipedia no?
Samlivet framover: Wikipedia og Akademia
Takk for merksemda!