Skip to content

GovDataOfficial/DCAT-AP.de-SHACL-Validation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DCAT-AP.de SHACL-Validation

⚠️ Hinweis zur aktuellen Entwicklung ⚠️
Die DCAT-AP.de SHACL-Validation wird aktuell mit Blick auf die DCAT-AP.de 3.0 Spezifikation weiterentwickelt.
Wenn Sie Fehler entdecken, dann freuen wir uns über Ihr Feedback!

DCAT-AP.de 3.0 - Spezifikation

Basiert auf dem Profil DCAT-AP 3.0 - Übersetzungen und Einschränkungen und ergänzt es um folgende Aspekte:

DCAT-AP 3.0 - Übersetzungen und Einschränkungen

Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.

Dieses Validierungsprofil basiert auf de SEMIC Datei (https://github.com/SEMICeu/DCAT-AP/blob/master/releases/3.0.0/shacl/dcat-ap-SHACL.ttl) erweitert um die Datei dcat-ap-SHACL-DE.ttl. Die deutschen Erweiterungen verändern die Validierung wie folgt:

  • Hinzufügen deutschsprachiger Fehlermeldungen
  • Deaktivierung von Shapes, die eine nicht sinnvolle Range prüfen

Betroffen sind die Klassen dcterms:Frequency, dcterms:LicenseDocument, dcterms:LinguisticSystem, dcterms:MediaType, dcterms:MediaTypeOrExtent, dcterms:ProvenanceStatement, dcterms:RightsStatement, dcterms:Standard, eli:LegalResource, foaf:Document, locn:Geometry, odrl:Policy, prov:Activity, prov:Attribution, rdfs:Resource, skos:Concept, skos:ConceptScheme und spdx:ChecksumAlgorithm.

DCAT-AP.de 2.0 - Spezifikation

Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.

Der deutsche Validator verwendet die verpflichtenden Regeln der SEMIC und reichert sie mit deutschen Fehlernachrichten an. Dazu werden folgende Dateien verwendet:

Die folgende Datei fügt zu den DCAT-AP-SHACL-Shapes deutsche Regeln hinzu, so dass DCAT-AP.de 2.0 geprüft wird. Dafür werden zum Teil auch widersprüchliche DCAT-AP-SHACL-Shapes deaktiviert:

Weitere externe Quellen, wie Ontologien, deren Kontext relevant sind oder kontrollierte Vokabulare, werden durch diese Datei importiert:

Prüfungen

  • Verwendung aller Pflichteigenschaften
  • Min- und Max-Kardinalitäten
  • Verwendung (getypter) Literals, wenn zutreffend
  • Verwendung von URIs, wenn als Ziel eine Klasse erwartet wird
  • Verwendung von URIs, wenn als Ziel eine beliebige Webadresse erwartet wird
  • Verwendung der korrekten kontrollierten Vokabulare
  • Warnung bei der Verwendung von deprecated-Eigenschaften

Ob das Objekt einer Eigenschaft die von DCAT-AP(.de) vorgegebene Klasse hat, wird geprüft, wenn der Aufbau des Objekts für den Anwendungsfall "Anlieferung an ein Metadatenportal" entscheidend ist. Dies betrifft die DCAT-AP-Kernklassen und Eigenschaften dcat:catalog, dcat:dataset, dcat:service, dcat:record und dcat:distribution sowie die Eigenschaften, die auf z.B. foaf:Agent, dct:PeriodOfTime oder dct:Location verweisen.

Für die Eigenschaften adms:sample, dct:source, dct:hasVersion, dct:isVersionOf, dct:hasPart und dct:isPartOf wird davon ausgegangen, dass deren Objekte nicht im Kern der Validierung stehen. Daher wird lediglich gewarnt, wenn sie nicht die korrekte Klasse haben.

Keine Prüfungen

  • Kategorie (da kontrolliertes Vokabular genutzt werden muss)
  • Kategorienschema (da kontrolliertes Vokabular genutzt werden muss)
  • Lizenzdokument (da kontrolliertes Vokabular genutzt werden muss)

DCAT-AP.de 2.0 - Spezifikation & Konventionen

Dieses Profil prüft alles, was DCAT-AP.de SHACL-Validation prüft. Zusätzlich:

Prüfung von Konventionen

  • K01: dcat:contactPoint: Kontaktinformationen MÜSSEN mindestens Angaben zur Email (vcard:hasEmail) oder einen Link zum Kontaktformular oder Chatbot (vcard:hasURL) enthalten.
  • K12&13: dcat:Dataset: dcatde:contributorID MUSS verwendet werden und DARF nur genau einmal eine IRI aus http://dcat-ap.de/def/contributors/ verwenden.
  • K36: dcat:Dataset: dct:publisher MUSS verwendet werden.
  • K30: dcat:Dataset: dcat:theme: Zur Steigerung der Metadatenqualität wird die Angabe von Kategorien empfohlen.
  • K31: dcat:Distribution: dct:license MUSS eine IRI aus http://dcat-ap.de/def/licenses/ verwenden.
  • K32: dcat:Distribution: dct:format MUSS eine IRI aus dem EU Vokabular 'File Type' verwenden.

Prüfung besonders empfohlener Eigenschaften

  • dcat:Dataset: dcat:distribution: Es wird empfohlen, dass jedes Dataset über eine Distribution verfügt.
  • dcat:Dataset: dcat:keyword: Zur Steigerung der Metadatenqualität wird die Angabe von Schlagworten empfohlen.
  • dcat:Dataset: dcat:landingPage: Zur Steigerung der Metadatenqualität wird die Angabe der ursprünglichen Webseite empfohlen.
  • dcat:Dataset: dct:issued: Zur Steigerung der Metadatenqualität wird die Angabe des Veröffentlichungsdatums empfohlen.
  • dcat:Distribution: dct:title: Es wird empfohlen, dass jede Distribution über einen dct:title verfügt.

Prüfung im Rahmen der Dublettenprüfung

  • dcat:Dataset: Ggf. MUSS dct:identifier zur Dublettenprüfung verwendet werden.
  • dcat:Dataset: Ggf. MUSS dct:modified zur Dublettenprüfung verwendet werden.

Prüfung auf (ausgewählte) sinnvolle Ranges

Die Auswahl erfolgte mit Blick auf die Verarbeitung im GovData-Frontend.

  • dcat:Dataset: IRIorLiteral: dct:conformsTo, dct:accessRights, dct:provenance
  • dcat:Dataset: IRI: prov:wasGeneratedBy, dcat:landingPage, foaf:page
  • dcat:Catalog: IRIorLiteral: dct:rights
  • dcat:Catalog: IRI: foaf:homepage
  • dcat:DataService: IRIorLiteral: dct:accessRights
  • dcat:Distribution: IRIorLiteral: dct:conformsTo, dct:rights
  • dcat:Distribution: IRI: foaf:page, odrl:hasPolicy
  • dcat:CatalogRecord: IRIorLiteral: dct:conformsTo

GovData MQA/Dashboard

Diese Profile prüfen Eigenschaften, die auch im GovData-Dashboard zur Metadatenqualität angezeigt werden.


Weitere Informationen

Feedback gerne als GitHub Issue oder per E-Mail an [email protected].

Bisherige Inhalte wurden in die Datei README_v1X.md verschoben.

© CC BY 4.0 ']init[ AG für GovData'