Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Eero Hyvönenprofessori, tutkimusjohtaja
Semantic Computing Research Group (SeCo)Aalto-yliopisto ja Helsingin yliopisto
http://www.seco.tkk.fi/
Sisältö
Mitä on yhdistetty avoin tieto (Linked Open Data)?Kansainvälinen ja kotimainen tahtotila tiedon avaamiseenKansallinen FinnONTO-visio (2003-2012) ja -infrastruktuuri
Mitä on yhdistetty avoin tieto (Linked Open Data)?
Avoin tieto – Open DataTieto vapaaksi!Kansalaisilla on oikeus avoimeen tietoonAvoimelle tiedolle syntyy ”itsestään” hyötysovelluksiaTiedon arvo kasvaa sitä jakamalla
– Yhden organisaation ja kokonaisuuden edut puntarissa
Tuotannon tehokkuus kasvaa– Miksi tuottaa uudelleen jo tuotettua tietoa?
Avoimuus parantaa yhteistyötä ja työnjakoa– Esim. Wikipedia
Avoimuus edistää yhteentoimivuutta– Keskinen kustannustekijä tietotekniikassa
Avoimuus asettaa haasteita mm. lainsäädännölle– Henkilösuoja, vapaa kilpailu, tekijänoikeudet,
tietoturva, ...
Tiedon vapauttaminen ei yksin riitä!
Open Data ei ota kantaa julkaisutapaan– Tietotekninen näkökulma puuttuu
Open Data ei ota kantaa yhteistyöhön– Web 2.0 -näkökulma puuttuu
Open Data avaa tiedon vain ihmiskäyttäjälle– Semanttisen webin näkökulma puuttuu
» Koneiden pitää ”ymmärtää” avointa tietoa!Linked Data on moderni ratkaisumalli
– Kehitysyhteisö http://linkeddata.org– Tukijoina mm. W3C
Linked Data: Idea
Nykyinen web on verkko joka linkittää sivuja: Web of Pages– Voidaan hakea/selailla perinteisellä selaimelle
Linked Data on semanttinen käsiteverkko: Web of Data– Voidaan hakea/selailla myös semanttisella sovelluksella
Uusi (semanttinen) web koostuu molemmista verkoista– Web of Pages (ihmiselle)
» WWW World Wide Web– Web of Data (koneelle)
» GGG Giant Global Graph
Web of PagesWWW
Web of Data GGG
Linked Data + Open Data = Linked Open Data
Kansainvälinen ja kotimainen tahtotila tiedon avaamiseen
Perinteinen malli: tiedon erilliset siilot + hankalaa ja kallista
Solution: Linked (Open) Data Ecosystem
OntologiesMetadata Schemas
Data Models
Linked Open Data
Public Sector
Scientific Research
Companies
Social Media
Humans Machines
1 +1 > 2M.O.T.
Britanniassa: http://data.gov.uk
Runsaasti sovelluksia verkossa
Linked Open Data esimerkkisovellus: BBC
USA:ssa http://www.data.gov
Opengov.XX portaalit eri maissa:opengov.fi, opengov.se, ...
Linked Open Data Story so FarStarting 2005
(Tim Berners-Lee)
New Datasets Linked with Others
(Tim Berners-Lee)
(Tim Berners-Lee)
Linked Open Data 2009
(linkeddata.org, 2009)
Linked Open Data Cloud 2010: http://linkeddata.org
Linked Open Data Cloud 2010: http://linkeddata.org
LOD Cloud Statistics
(Heath, Bizer, 2011)
Suomessa on kansallinen tahtotila tiedon avaamiseen
Valtiovarainministeriö– ValtIT:n Valtiotason tietoarkkitehtuurit -loppuraportti – Tietohallintolaki (”FinnONTO-laki”) on juuri hyväksytty eduskunnassa
Liikenne- ja viestintäministeriö– Hallituksen periaatepäätös tiedon avaamisesta– Avoin data mukana uudessa hallitusohjelmassa
Opetus- ja kulttuuriministeriö– Tutkimuksen tietoaineistot –selvitys– Kansallinen digitaalinen kirjasto –hanke
ICT-teolllisuus– ICT-klusteri Tivitin Data to Intelligence -ohjelma (2012-)?– HS Open, Apps4Finland, Avoimen datan foorumi, …
Tutkimus (tietotekniikka)– Kansallinen FinnONTO-hanke (2003-2012)– Linked Data Finland (2012-2014)
Kansallinen FinnONTO-visio ja -infrastruktuuri
FinnONTO Vision 2003-2012
Semantic Web needs a content infrastructure– Like traffic needs roads– Like energy service needs powerlines– Like mobile phones need GSM or 3G-networks
Especially useful in– Cross-domain applications– Collaborative Web 2.0 applications
Let’s create it together on a national level– Based on W3C’s generic standards
FinnONTO Industrial & Public Organization Consortium
FinnONTO– 2003-2004
» 14 funding organizations – 2004-2005
» 16 funding organizations – 2005-2006
» 30 funding organizations– 2006-2007
» 37 funding organizationsFinnONTO 2.0
– 2008-2010» 38 funding organizations
– 2010-2012» 35 funding org.
1.52 MEUR
Linked Data Finland 2012-2014» 21 funding organizations
2010-2012 Semantic UBICOM-services17 funding org0,55MEUR
Antikvaria-ryhmä
40+ partners in FinnONTO (2003-2012)Research mainly by Aalto and University of Helsinki
FinnONTO Results
Linked open ontology infrastructure– KOKO ontology cloud– Data registries (e.g. persons, places, history events)– International vocabularies
National ontology library service ONKI http://onki.fiCase applications (based on reusable tools)
– eCulture: MuseumFinland, CultureSampo, BookSampo, TravelSampo
– eHealth: HealthFinland, ActiveFinland– eBusiness: CorporateFinland, case Wärtsilä, case Rautaruukki,
…– eGoverment: Semantic Suomi.fi, DataFinland, case Finnish
Defense Forces, …Everything open source
YSO
AFOMAO
TAO
VALO
KOKO ......
Linked Open Ontologies:KOKO Ontology Cloud
Your ontology?
Aligning ONKI ontologies
[Hyvönen et al., ESWC 2009]
Leikkaavat ontologiat
Yhteisten ekvivalenttien käsitteiden määrä
YSO + TAO 1990YSO + MAO 2330YSO + VALO 950MAO + TAO 1190
KOKO sovelluskäyttäjän näkökulmasta
Thesaurus-based Ontologies in the KOKO Ontology System
Name Ontology domain Underlying thesaurus Size Organization1 YSO General domain General Finnish Thesaurus YSA, Allärs 23700 National Library, Åbo Academy2 MUSO Music Musiikin asiasanasto MUSA, CILLA 1000 National Library3 MAO Museum domain Museoalan asiasanasto MASA 6800 National Board of Antiquities4 AFO Agriculture, foresty Agriforest-asiasanasto 5500 Viikki Science Library
5TAO Applied arts Käsi- ja taideteollisuuden asiasanasto 2600 University of Eastern Finland,
Library of TAIK
6VALO Photography Valokuvakirjallisuuden asiasanasto,
Valokuvaustekniikan asiasanasto1900 Finnish Museum of Photography et
al.7 MERO Seafaring, shipping Merenkulkun asiasanasto 1400 Liikennevirasto et al. 8 KAUNO Literature subjects Kaunokki, Bella 4900 Public Libraries, Kirjastot.fi9 JUHO Public goverment Valtioneuvoston asiasanasto VNAS 6400 Ministry of Finance
10 TERO Health promotion YSA, HPMulti, MeSH, Stameta 22000 National Inst. of Health and Welfare11 KITO Literature research Kirjallisuuden tutkimuksen asiasasanasto 900 SKS12 KULO Culture research Kulttuurien tutkimuksen asiasanasto 1600 SKS13 KTO Linguistics Kielitieteen asiasanasto 1000 Kotus14 PUHO Defense Puolustushallinnon asiasanasto Puolustusvoimat15 POIO Points of interest TGN, Geonames, LDG, SUO Aalto Univerisity
TOTAL 79700
KOKOs Component Ontologies 2/2011
Biological Namelists of Finnish Museum of Natural History in ONKI (10/2011)
vuosi alue ryhmä taksoneita joista lajeja
Catalogus Lepidopterorum. Fenniae et regionum adiacentium. 1. Macrolepidoptera. 1962 Suomi Perhoset 313 161
Suomen perhosten luettelo 1977 Suomi Perhoset 256 120
The Lepidoptera of Europe. A Distributional Checklist 1996 Skandinavia Perhoset 12256 9804
Checklist of Finnish Lepidoptera 2002 Suomi Perhoset 265 126
Suomen perhosten luettelo - päivitetty versio 2008 Suomi Perhoset 4573 2987
Norwegian Lepidoptera 2008 Norja Perhoset 3244 2210
Catalogue of the Lepidoptera of Russia (only NW parts) 2008Luoteis-Venäjä Perhoset 3251 2171
Estonian Lepidoptera. Catalogue 2008 Viro Perhoset 3477 2389
The Fly Fauna of Finland (Draft) 2008 Suomi Kärpäset 6351 4800Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 1. heimo Ichneumonidae, alaheimot Pimplinae, Poemeniinae, Rhyssinae ja Diacritinae - A check list of Finnish Hymenoptera, Parasitica. Part 1 1995 Suomi Loispistiäiset 282 210Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 2. alaheimot Tryphoninae, Eucerotinae, Adelognathinae, Xoridinae ja Agriotypinae - A check list of Finnish Hymenoptera, Parasitica. Part 2 1999 Suomi Loispistiäiset 398 311Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 3. alaheimo Cryptinae - A check list of Finnish Hymenoptera, Parasitica. Part 3 1999 Suomi Loispistiäiset 919 727Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 4. heimo Ichneumonidae, alaheimot Lycorinae, Neorhacodinae, Stilbopinae, Banchinae ja Ctenopelmatinae - A Check list of Finnish Hymenoptera, Parasitica. Part 4 2000 Suomi Loispistiäiset 786 646Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 5. heimo Ichneumonidae, alaheimot Tersilochinae, Ophioninae, Anomalinae, Paxylommatinae, Cremastinae ja Campopleginae - A check list of Finnish Hymenoptera, Parasitica. Part 5 2003 Suomi Loispistiäiset 733 587
Suomen ripsiäisten luettelo - Checklist of Finnish Thysanoptera 2008 Suomi Ripsiäiset 219 140
Suomen nivelkärsäisten luettelo - Check-list of Finnish Hemiptera 2008 Suomi Nivelkärsäiset 2690 1697
Suomen verkkosiipiset ja kärsäkorennot - The Neuroptera s.l. and Mecoptera of Finland 2008 SuomiVerkkosiipiset ja kärsäkorennot 113 72
Maailman lintujen suomenkieliset nimet (Finnish Names of the Birds of the World) 2010 Maailma Linnut 12125 9740
Nisäkkäiden nimilista (beta) 2008 Maailma Nisäkkäät 6062 4629
Suomen myrkkypistiäisten luettelo 2010 Suomi Myrkkypistiäiset 1048 664
International Ontologies in ONKIhttp://onki.fi/
Art and Architecture Thesaurus (AAT) (culture)Library of Congress Subject Headings (LCSH) (library)UNSPSC (products and services)IPSV (eGov)MeSH (medical)Iconclass (culture)…
Muita ontologioita
Paikkaontologiat– Maanmittauslaitoksen paikannimirekisteri– Suomen ajallinen paikkaontologia– ONKI Geo
Henkilöt– ONKI People
Historialliset tapahtumat– Aineistona historiantutkijoiden yhteisön Agricola-aikajana
Kansallinen ontologiakirjastopalvelu ONKI
http://onki.fi/
ONKI-palvelukonseptin idea
ONKI tarjoaa kansalliset keskitetyt sanasto/ontologiapalvelut valmiina toiminnallisuuksina, jotka voidaan integroida kustannustehokkaasti osaksi sovelluksia
– Käsitteiden haku, selailu, valinta, laajennus, kääntäminen – Hieman vastaavaan tapaan kuin esimerkiksi Google Maps
tarjoaa karttapalvelut sovellusten käyttöön
Käyttötapaukset– Tiedon indeksointi sisältöä tuotettaessa
» Museot, virastot, kirjastot, mediayritykset, kansalaiset ...– Tiedon haku
» Esim. synonyymit, kyselyn laajentaminen, monikielisyys– Sanastojen kehittämisen ja julkaisemisen tuki
ONKI:n käyttöönottotilanne 9 / 2011
Prototyyppi Living Laboratory –ympäristössä 2009-2011– Ihmiset: 15 000+ uniikkia käyttäjää / kk (domain)– Koneet: 310 rekiströitynyttä käyttäjää (domain)
ONKI konsortio –valmisteilla – ONKI:n ylläpito FinnONTO:n jälkeen (2012-)– Kansalliskirjasto ryhtymässä vetäjäksi (suunnitelma)– Hakemus arvioitavana OKM:ssä ja VM:ssä
A FinnONTO applicationCultureSampo – Finnish Culture on the Semantic Web 2.0
Käytännön esimerkki mahdollisuuksista:FinnONTO:n Kulttuurisampo (2005-)
Kulttuurisampo – suomalainen kulttuuri semanttisessa Web 2.0:ssa
– Kansallinen kulttuurialan yhteisöllinen julkaisukanava Linked Open Data –hengessä
– Museot, kirjastot, arkistot– Kansalaiset
http://www.kulttuurisampo.fi
Finnish Content Providers1 Agricola – Suomen historiaverkko2 Espoon kaupunginmuseo3 Helsingin kaupunginkirjasto4 Hiihtomuseo5 Jyväskylän yliopisto, musiikin laitos6 Kansallisbiografia7 Kansallismuseo8 Kuopion kulttuurihistoriallinen museo9 Laatokan-Karjalan museo
10 Lahden kaupunginmuseo11 Museovirasto12 Pohjois-Karjalan museo13 Radio- ja TV-museo14 Seurasaaren ulkomuseo15 Suomalaisen Kirjallisuuden Seura SKS16 Suomen maatalousmuseo Sarka17 Suomen merimuseo18 Taideteollisen korkeakoulun kirjasto19 Valtion taidemuseo20 Veljekset Karhumäki Oy21 Viipurin historiallinen museo22 Yleisradio Oy
International Content Providers1 Geonames2 Google (Maps)3 Iconclass (vocab.)4 Panoramio5 Paul J. Getty Foundation (vocab.)6 Wikipedia
Haaste 1: Kulttuurisisältöjen tuotantoHajautettu, ei yhteisöllisyyttä, ei koordinaatiota
Haaste 2: Kulttuurisisältöjen monimuotoisuus Erilaiset, mutta toisiinsa liittyvät sisällöt
Encyclopedia
Artifacts Maps
Videos
Buildings
Fine artsBiographies
Narratives Literature
Cultural sites
Music
National FinnONTOOntology
Infrastructure
Kulttuurisammon ratkaisu pähkinänkuoressa
SemanticMetadata
ContentProviders
Biografiakeskus ja kirjastot keräävät henkilöhistoriaa
henkilö nimi ammatti syntymapaikka ...H1 Akseli Gallen-Kallela taiteilija LemuH2 Gustaf Mannerheim marsalkka Askainen
...
H1
Lemu
taiteiijaihminen
”Akseli Gallen-Kallela”
H2
Askainen
marsalkka
”Gustaf Mannerheim”
tyyppi
tyyppi
nimi
nimi
ammatti
ammatti
s-paikka
s-paikka
Museo luetteloi maalauksia
...
T1
1929
maalaus
tekijä
aika
tyyppi
”Gustaf Mannerheim”nimi
aihe
nimi”Akseli Gallen-Kallela”
teos nimi tekijä aika aihe ...T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf MannerheimT2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala
...
Maanmittauslaitos ylläpitää paikkarekistereitä
Varsinais-Suomen lääni Suomi
Askainen
Lemu
Turku
kunta lääniAskainen Varsinais-Suomen lääniHelsinki Uudenmaan lääniLemu Varsinais-Suomen lääniTurku Varsinais-Suomen lääni...
part-ofpart-of
part-of
part-of
kunta
tyyppi
lääni
tyyppi...
tyyppi
FinnONTO kehittää ontologioita
taiteiijaihminen
marsalkka
maalaus
käsite
pysyvä
paikka
ammatti kunta
yläluokka
yläluokka
yläluokka
yläluokka
yläluokka
ajanjakso
yläluokkaabstraktimuuttuva
fyysinen objekti
lääni
KOKO-ontologia
Semanttinen RDF-verkko yhdistää kaiken: Web of Linked Open Data (GGG)
H1
Lemu
taiteiijaihminen
”Akseli Gallen-Kallela”
H2
Askainen
marsalkka
”Gustaf Mannerheim”
tyyppi
tyyppi
nimi
nimi
ammatti
ammatti
s-paikka
s-paikka
T1
1929
maalaus
tekijä
aiheaika
tyyppi
Varsinais-Suomen lääni Suomi
Turku
part-of part-of
part-of part-of
käsitteet
pysyvä
paikka
ammatti kunta
tyyppi
tyyppi
tyyppi
yläluokka
yläluokka
yläluokka
yläluokka
yläluokka
ajanjakso
yläluokkaabstraktimuuttuva
fyysinen objekti
lääni
yläluokka
...
Initial Culture Sampo RDF Knowledge Base (March 17, 2009)
Metadata– 134,000 cultural collection items (artifacts, books, videos etc.)– 285,000 other resources (places, persons etc.)– 204 property types in metadata
Ontologies– KOKO ontologies (ca. 37,000 concepts)– Additional international vocabularies
» AAT, ULAN, Iconclass– 253 property types in ontologies
Size– 11,4 million triples (arcs in the RDF graph)
New datasets (2011) contain billions of triples
Yhteenveto
(Meta)tieto kannattaa avata semanttisesti yhteentoimivasti– Oma tieto yhdistyy muiden tietoihin– Oma (ja muiden) tieto rikastuu semanttisesti– Semantiikka mahdollistaa ”älykkäät” sovellukset– W3C.n semanttiset web teknologiat tarjoavat standardin
ratkaisumallin ja kansainvälisen LOD-viitekehyksen– FinnONTO:n tulokset ovat käytettävissä avoimesti
– Tutkimustyö jatkuu: Linked Data Finland (2012-)
Lisätietoja
Yhteenveto suomeksi FinnONTO-ontologiavisiosta– Eero Hyvönen: FinnONTO-malli kansallisen semanttisen webin
sisältöinfrastruktuurin perustaksi - visio ja sen toteutus. Julkistustilaisuuden esitelmä, TKK, 12.9.2008.http://www.seco.tkk.fi/publications/2008/hyvonen-ONKI-yleisesitys-2008.pdf
Yhteenveto suomeksi Kulttuurisampo-visiosta– Eero Hyvönen: Kulttuurisampo - suomalainen kulttuuri
semanttisessa webissä. Muistiorganisaatioiden ja kansalaisten yhteisöllinen kansallinen julkaisujärjestelmä Julkistustilaisuuden esitelmä, TKK, 25.9.2008.http://www.seco.tkk.fi/publications/2008/hyvonen-Kulttuurisampo-2008.pdf
FinnONTO-projekti, Semantic Computing Research Group, Aalto jaHelsingin yliopisto:
– http://www.seco.tkk.fi/projects/finnonto/