Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)

  • Published on
    07-Jul-2015

  • View
    366

  • Download
    4

Embed Size (px)

DESCRIPTION

Prsentation von Martin Kaltenbck (SWC) bei den Wissenschaftstagen der Akademie der Wissenschaften am 3.12. 2014 zum Thema - Einfhrung, Basis und Benefits von Linked Open Data (LOD) inkl. Best Practise: Linked Open Data Pilot sterreich (LOD Pilot AT - http://linkeddata.gv.at).

Transcript

  • 1. Linked Open Data (LOD)Basis, Principles, Benefits; Best Practise: LOD PILOT Austria/Martin KaltenbckCFO, Semantic Web Companywww.semantic-web.atwww.poolparty.biz@semwebcompanyDigital Humanities Tage, 3.12.2014, Wien

2. IntroductionSemantic Web Company (SWC) 3. About Semantic Web CompanyCompany was founded 2001 in Vienna, Austria>20 experts in linked data technologiesProduct: PoolParty Suite (launched 2009)Serving global 500 companiesEU- & US-based consulting services 4. Customers we serveFinance / Automotive / Publisher / Health Care / Public Administration /Energy / EducationCustomers Credit Suisse Daimler Roche Wolters Kluwer Tieto Canadian BroadcastingCorporation (CBC) World Bank Group The Pokmon Company Healthdirect Australia Ministry of Finance (A) Wood Mackenzie Red Bull Media House Council of the E.U. TC Media American Physical Society Education Services Australia Pearson Techtarget Norwegian Directorate ofImmigration REEEP European Commission Bank of AmericaPartners Cognizant EBCONT EPAM Systems iQuest PwC DTI AG Tenforce OpenLink Software Ontotext MarkLogic Gravity Zero Altotech Wolters Kluwer Term Management Taxonomy Strategies Search explained WAND Digirati Cognistreamer Linked Data Factory Taxonic semweb 5. 2 Main Areas of WorkPoolParty Semantic Suitehttp://www.poolparty.bizData-, Information- and Knowledge Portalsand Data Tools, http://bit.ly/1DWtp1awww.buildingsdata.euwww.gbpn.orgwww.eip-water.euwww.reegle.info 6. SolutionsThesaurus Publishing Business Intelligence Content Recommendation Semantic Expert FinderWeb Mining Semantic Search Semantic Tagging inSharePointSymptom Checker 7. About me Background: Communication Science, Psychology & Marketing Work: Requirements Engineering & PM of nat. & internat. Industry & Research Projects Co-Founder, CFO & Managing Partner SWC, www.semantic-web.at Advisory Board Member Open Knowledge UK, www.okfn.org Executive Board Member OKF Austria, www.okfn.at Founding Member of Cooperation OGD Austria Invited Expert in W3C and ISA Working Groups on Data Management Issues Steering Group Member, European Data Forum (EDF), www.data-forum.eu 8. Open (Government) Data 9. 9Was istW Oapse inst GOopveernn mGeonvte? rnmentHier wird eine moderne Zusammenarbeit vonPolitik, Verwaltung, Zivilgesellschaft undWirtschaft postuliert, mit den Zielen: Transparenz zu frdern Partizipation und Kollaboration zu ermglichenTeilbereich von Open Government =Open Government Data 10. Was ist Open Government Data?Was ist Open (Government) Data?OKFO Open Knowledge Forum sterreichOpen Government Data is a worldwide movement to open data(& information/content) of the government / public administration* - that isNOT personal (individual related) in human- AND maschine-readableopen (non proprietary) formats for re-use (by civil society, economy, media,academia AND politics & public administration itsself)!.. data and information produced or commissioned by government or government controlled entitiesLucke & Geiger (Zeppelin Universitt, DE)Offene Verwaltungsdaten sind jene Datenbestnde des ffentlichenSektors, die von Staat und Verwaltung im Interesse der Allgemeinheit ohnejedwede Einschrnkung zur freien Nutzung, zur Weiterverbreitung und zurfreien Weiterverwendung frei zugnglich gemacht werden.OKFO http://www.okfn.atProf. Dr. Jrn von Lucke Christian P. Geiger, M.Ahttp://www.zeppelin-university.de/deutsch/OKF-AT: http://www.okfn.at ; @OKFNat 11. 8 Prinzipien von Open Government Data111. VollstndigkeitAlle ffentlichen Daten werden verfgbar gemacht. Als ffentliche Daten werden hierbei Daten verstanden, dienicht berechtigten Datenschutz-, Sicherheits- oder Zugangsbeschrnkungen unterliegen.2. PrimrquelleDie Daten werden an ihrem Ursprung gesammelt. Dies geschieht mit dem hchstmglichenFeinheitsgrad, nicht in aggregierten oder sonst wie modifizierten Formaten.3. ZeitnahDaten werden so zgig, wie zur Werterhaltung, notwendig zur Verfgung gestellt.4. Leichter ZugangDer Zugang zu Daten soll so leicht wie mglich sein (z.B.: Angebot von Formaten, APIs etc).5. MaschinenlesbarDaten werden zur automatisierten Verarbeitung strukturiert zur Verfgung gestellt.6. Nicht diskriminierendDaten sind fr ALLE verfgbar, ohne dass z.B. eine Registrierung notwendig ist.7. Nicht proprietrDaten werden in standardisierten Formaten bereit gestellt, ber die keine juristische Persondie alleinige Kontrolle hat.8. LizenzfreiDaten unterliegen keinem Urheberrecht, Patenten, Markenzeichen oder Geschftsgeheimnissen. SinnvolleDatenschutz-, Sicherheits- und Zugangsbeschrnkungen sind zulssig.Die Einhaltung dieser Prinzipien ist berprfbar.PLUS: Sunlight Foudation, August 2010: 9) Dauerhaftigkeit / Stetigkeit & 10) Nutzungskostenhttp://www.opengovdata.org/home/8principleshttp://sunlightfoundation.com/policy/documents/ten-open-data-principles/8 Prinzipien von Open Government Data 12. Open Data 12Verstrkt werden Daten auch durch Nichtregierungen geffnet undzur Wiederverwendung bereitgestelltODPOpen Data Portal sterreichwww.opendataportal.atEine Kooperation vonOKF-AT, Wikimedia AT undCooperation OGD sterreichSingle Point of Access fr Daten aus: Wirtschaft Wissenschaft GLAM NPO & NGO Gesellschaft / Privatpersonen 13. Open Data in Europe13Bis zu 100 Mio Euro durchProjekte, H2020 Research et al EU Data Incubator 2015 Launch Pan EU Data Portal H2020: Open & Big Data Uptake EC Open Data Portal LOD as objective for publishing EU28 National Open Data Activities Austria: UN Public Award & EDI Award 14. Open Data in use14Was ist wichtig, wenn man ber Open Data in Use nachdenkt? Interoperabilitt um breite & einfache Nutzung zu ermglichen Menschen- UND Maschinen- Lesbarkeit von Daten & Metadaten In mglichst offenen Formaten Fr eine rasche und kosteneffiziente Datenintegration Um auf mehreren Ebenen Effekte & Nutzen generieren zu knnen:Lokal - Regional - National - EU-weit & WeltweitFr verschiedene Nutzergruppen mit verschiedenen Interessen ffentliche Verwaltung (auch fr interne Nutzung!) Politiker und Entscheidungstrger Brger & Zivilgesellschaft (Citizen Analysts) Wirtschaft & Industrie (Datenintegration, -anreicherung, APPs, ) (Daten) Journalismus, Medien & Publisher Lehre & Wissenschaft 15. Putting the L in frontVon Open Data zu Linked Open Data (LOD) 16. Interoperabilitt16Henry Maudslay (1771 1831)He also developed the first industrially practicalscrew-cutting lathe in 1800, allowingstandardisation of screw thread sizes for the firsttime. This allowed the concept ofinterchangeability (a idea that was already takinghold) to be practically applied to nuts and bolts.Before this, all nuts and bolts had to be made asmatching pairs only. This meant that whenmachines were disassembled, careful account hadto be kept of the matching nuts and bolts ready forwhen reassembly took place.http://en.wikipedia.org/wiki/Henry_MaudslayJohn Sheridan, OGD2011 Conference, Vienna, Austria:http://www.slideshare.net/semwebcompany/linking-uk-government-data-john-sheridan/ 17. 5 Stars for Open Data by Tim Berners Lee17 18. 18Documentson theWebWeb of DocumentsAKA HypertextData on theWebAKA Open DataWeb of DataAKA HyperdataThe Evolution of the Internet 19. Tim Berners-Lee outlined four principles of linked data in hisDesign Issues: Linked Data Use URIs to denote things. Use HTTP URIs so that these things can be referred to andlooked up (dereferenced) by people and user agents. Provide useful information about the thing when its URI is de-referenced,leveraging standards such as RDF, SPARQL. Include links to other related things (using their URIs) whenpublishing data on the Web.Further Reading: Wikipedia W3C WikiLinked Data Design Principles19 20. Von Open Data zu Linked Open DataVon Open Data zu Linked Open DataProvide an API! Give things an URI! Use RDF for Publishing! Link your Data to other Data(as well as the data models)! Provide a Standard-API on topOrganise Data!License Data!Raw Data now!20Publish Data!Use Web-Technologies The web is an Ecosystem Use Linked Data! Networked Data createsNetwork Effects Lowers Costs of DataIntegration 21. Die Idee von Hyperdata21Die Idee von HyperdataData Integration on User Level and Application Level 22. Die Idee von Hyperdata22Die Idee von HyperdataApplication and/or APIIntegration on Data Level 23. Linked Data realizes the vision ofevolving the Web into a global datacommons, allowing applications tooperate on top of an unbounded set ofdata sources, via standardisedaccess mechanisms.I expect that Linked Data will enable asignificant evolutionary step in leadingtheWeb to ist full potential.CC-BY-SA von campuspartybrasil (flickr)The Vision of the new Internet23 24. Linked Open Datain a Nutshell 25. 1. Uses RDF Data ModelLOD WS03.12. 2014ViennaSWCpresents atstartstakesPlaceInSubject Predicate Object2. Is serialised in triples:SWC presents at LOD WS .LOD WS starts 20141203^^xsd:date .LOD WS takesPlaceAt Vienna .3. Uses Content-negotiationLinked Data in a Nutshell25 26. 1. Identify & analyse your data2. Clean the dataQuick Guide: Publish LOD3. Model your data (URI schema, vocabularies)4. Select & specify license(s)5. Convert data to RDF6. Link your data to other data7. Publish and promote your Linked Open Data26 27. Quick Guide: Consume LOD1. Specify concrete use cases2. Evaluate relevant data sources & data sets3. License clearing: check respective licenses4. Create data consumption patterns5. Manage alignment, caching & update mechanisms6. Create mash-ups, GUIs, services & applications on top7. Establish sustainable new partnerships27 28. Establishing a digital LOD based Data Infrastructure for Austriahttp://www.linkeddata.gv.at (coming soon)LOD Pilotsterreich 29. Anforderungen an Open Data in AT Wiederverwendung erleichtern durch Standard Formate Effiziente Datenintegration ermglichen (z.B. durch APIs) Daten vernetzen um die echten Potentiale zu heben (LOD) Die wichtigsten Basisdaten zentral bereitstellen Den digitalen Standort sterreich attraktiv gestalten Internationalen Trends & Standards folgen Bereitstellung von vertrauenswrdigen Datenquellen welchevon Verwaltung, Wirtschaft, F&E und Gesellschaft verwendetwerdet knnen29 30. Anforderungen an Open Data in ATRelevante & wichtigste ~30-50 Basisdaten evaluierenPostleitzahlen (PLZ)Politische BezirkePoints of InterestDemographische BasisdatenSchultypenIndustriesektorenDaten mit (trusted) URIs (Uniform Resource Identifier) versehenDatenstze nach RDF (Resource Description Framework) konvertierenDaten untereinander und extern (Dbpedia, Eurovoc, ..) verlinkenBasisdaten via HTTP frei verfgbar machen (unter: data.gv.at)Die LOD Infrastruktur zur breiten Verwendung bewerbenAdd on: LOD basierte Use Cases realisieren30 31. Anforderungen an Open Data in AT31 Projekt Set Up Identifizieren & Ansprache von relevanten Stakeholdern Aufbau von Kooperationen Projekt Setup: Team, Umfeld, Spezifikation- & Data Analyse Phase Workshops mit relevanten Stakeholdern Core Datenstze spezifizieren, URI Konzept, Lizenz, Rechtl. Fragen Spezifikation der Infrastruktur, Architektur und Tools Implementierungs Phase Technische Implementierung (Infrastruktur, Tools, et al) LOD Publishing / Datenpublikation Promotion, Events & Trainings, Support Maintenance & Operation Phase Laufende Maintenance Support fr zuknftige Publikation und Verwendung11-12/201301 - 04/201405- 10/2013from 11/2014 32. LOD Pilot: DatenanalyseIn zwei Workshops, mit gesamt 20 TeilnehmerInnen, wurden mit Expertenunterschiedlicher Einrichtungen Basisdatenstze ermittelt, wobei entlang derKategorisierung von help.gv.at (sprich: Lebenslagen) vorgegangen wurde.32 2 Stakeholder Workshops: 10.12. 2013 & 14.2.2014 Evaluierung & Analyse data.gv.at ( & opendataportal.at) Empfehlung EC zu Open Data (Link) G8 Open Data Charter (Link) & EC Implementierung (Link) Konzept Basic Data Dnemark (Link) 33. LOD Pilot: Tools & Architektur PoolParty Server fr LOD Publishing:Conversion Creation- Linking Publikation von Taxonomien, Code Listset al: http://www.poolparty.biz/33 Virtuoso Triple Store frDatenspeicherung & SPARQL Endpoint:http://virtuoso.openlinksw.com/ ETL & andere LOD Jobs: UnifiedViewshttp://www.semantic-web.at/linked-open-data-management-suite-lodms/ SILK fr Linking: http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/ Weitere RDF Converter wie Triplify oder D2R etal: http://d2rq.org/d2r-server 34. Anforderungen an Open Data in AT Aufbau & Etablierung einer Basis LOD Infrastruktur fr AT Angebot eines zentralen Repositories fr semantische Assets insterreich (nach ISA Ansatz, beschrieben in ADMS) Angebot & Etablierung von offiziellen & vertrauenswrdigenreferenzierbaren Entitten Angebot von Basisdaten, um Impact zu generieren (Bspl. DK) Umsetzung von LOD Use Cases um Potentiale aufzuzeigen Data Literacy vorantreiben durch LOD Trainings Alle relevanten Stakeholder zusammenbringen Die (Linked) Open Data Community einbinden (WU, TU, )34 35. ContactMartin KaltenbckCFO, Semantic Web Company+43 1 4021235m.kaltenboeck@semantic-web.atwww.semantic-web.atwww.poolparty.bizThese slides are published under :Copyright SWC 2014 36. Gruppenarbeit Frage 1: welche Basis Datenstze sehen Sie in IhrerOrganisation (Orte, Branchen, Organisationen, )36 Frage 2: Welche Datenstze wrden (intern /extern) verlinkt Ihrer Ansicht nach Mehrwertgenerieren?Organisation 1Organisation 2Organisation 3Dataset 1Dataset 2Dataset 3Dataset 1Dataset 2Dataset 3Dataset 1Dataset 2Dataset 3 37. The Benefits of Linked Open Data Less replication (offering same datasets in differentplaces) Encouragement to re-use existing datasets (openstandards, open formats, reduce semantic &syntactic heterogeneity) Clear which datasets are providingsimilar / same information More innovation and creation of newknowledge by contextualisation Creating network effects by linking Enable scale out of the growing amounts of data37 38. From Open Data 2 Linked Open DataWhat are the costs and benefits of web data?As a consumer ... You can look at it. You can print it. You can store it locally (on your hard drive or on an USB stick). You can enter the data into any other system. You can change the data as you wish. You can share the data with anyone you like.As a publisher ... It's simple to publish. You do not have explain repeatedly to others that they can use your data.5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/38 39. From Open Data 2 Linked Open DataWhat are the costs and benefits of web data?As a consumer you can do all what you can do with Web data and additionally: You can directly process it with proprietary software to aggregate it,perform calculations, visualise it, etc. You can export it into another (structured) format.As a publisher ... It's still simple to publish.5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/ 39 40. From Open Data 2 Linked Open DataWhat are the costs and benefits of web data?As a consumer you can do all what you can do with Web data and additionally: You c...

Recommended

View more >