34
Donat Agosti Plazi http://plazi.org OpenData.ch/2015 1. Juli, Uni Bern Open Biodiversity Data: Auf der Suche nach den verlorenen Arten

20150701 opendata bern_agosti_2

  • Upload
    agosti

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Donat Agosti Plazihttp://plazi.org

OpenData.ch/20151. Juli, Uni Bern

Open Biodiversity Data:Auf der Suche nach den

verlorenen Arten

Lateinische Namen als Zugang zur Wissenschaft

Treatment

XML

RDF

Die wissenschaftliche Herausforderung

1 tnntttccca cgaataaata atataagatt ttgattatta cctccttctt taattttatt 61 attatcaaga agattagttt ataaaggagt aggaacagga tgaactgttt atcctccttt 121 atctaataat ttatatcata atggattttc aactgattta gcaatttttt ctttacatat 181 tgcaggaata tcatcaatta taggagcaat taattttatt tcaacaattt taaatataca 241 tcataaaaat ttatcattag ataaaattcc attgttagtt tgatcaattt taattacagc 301 tattttatta ttattatctt tacctgtatt agcaggtgca attactatat tattaactga 361 tcgaaatcta aatacaactt tttttgatcc ttcgggtgga ggagatccaa ttttatatca 421 acatttattt

Die wissenschaftliche Herausforderung

Die wissenschaftliche Herausforderung

Die wissenschaftliche Herausforderung

LODPDF

HNS

HNS

Die wissenschaftliche Herausforderung

Die wissenschaftliche Herausforderung

Die wissenschaftliche Herausforderung

Die Plazi Vision: Giant Global Biodiversity Graph

LegalSocialTechnicalOntologiesInfrastructure

500 M pages 5*

What does this mean?

The Linking Open Data cloud diagram

Linked Open Data Cloud

Plazi Arbeitsablauf

Plazi SRS

find scan «OCR» markup store +access

Schwerpunkt auf Zugang zu Biodiversitätsdaten.

Text

<tax:treatment> <tax:nomenclature> <tax:name> <tax:xid source="HNS" identifier="193329"/> <tax:xmldata> <dc:Genus>Mystrium</dc:Genus> <dc:Species>leonie</dc:Species> </tax:xmldata> Mystrium leonie </tax:name> <tax:status>n. sp.</tax:status> Fig 1 D - F </tax:nomenclature> <tax:div type="description"> <tax:p>HOLOTYPE WORKER: TL 3.95, HL 1.02, HW 0.95, CI 93, SL 1.30, SI 137, PW 0.73, ML 0.38. Mandible outer margin strongly curving to a sharp apical tooth, the apex parallel to the anterior clypeal margin. (Holotype with material in mandibles, so mandibles and anterior clypeus $ described below from paratypes.) Median clypeus....</treatment>

Semantisch erweiterter Text(TaxonX)

… alternatives: From human to machine readable text

RDF

Treatment

Verlinkung der Daten mit externen Referenzen

5*2014

NCBI

Zugang zu wissenschaftlicher Literatur: DOI via Zenodo/CERN

Plazi Arbeitsablauf: wissenschaftliche Namen

Plazi Arbeitsablauf: Tabellen

«Treatment»Wissenschaftliche ArtnameVerbreitungsnachweisBibliographische RecordsExterne Links

ENVO?Namen

Cataglyphis tartessica workersVariable mean ± SDHead length 11.23 ± 0.12Head width 11.15 ± 0.12Scape length 11.47 ± 0.12Mesosoma length 11.94 ± 0.16Femur length 12.03 ± 0.14Cephalic index 0 93.60 ± 3.940Scape index 128.10 ± 7.660

Plazi Arbeitsablauf: Auffinden und “parsing” von Bibliographischen Referenzen

Plazi Arbeitsablauf: Datamining für Beobachtungsdaten

Plazi Arbeitsablauf: “Treatment”: eine Kombination von Werkzeugen

Status quo

• 50,000+ treatments life• RDF in Betaversion• GoldenGate Imagine (Text mining tool) in Betaversion• Provider für Daten für NCBI, GBIF, EOL, antweb• Biodiversity Literature Repository functional

Next steps

• 1 Million treatments life• RDF Version 1• GoldenGate Imagine (Text mining tool) Version 1• Provider für Daten für NCBI, GBIF, EOL, antweb• Biodiversity Literature Repository mit 100,000

Bibliographischen Referenzen und digitalen Versionen

Danke!

Donat [email protected]