FAIR und Open Data

Während Open Data eine uneingeschränkte Öffnung der Daten verlangt, verfolgen die FAIR-Prinzipien einen pragmatischeren Umgang mit Daten und erlauben nivellierte Zugangskriterien, die wissenschaftlichen Anforderungen entsprechen. Daten können FAIR sein, obschon sie nicht 'Open' sind.

FAIR Data

Die FAIR-Prinzipien zielen auf eine wissenschaftliche Verzeichnung der Daten ab, so dass diese im schnelllebigen Internet möglichst persistent adressiert, zitiert und verifiziert werden können. Der SNF richtet seine Forschungsförderung auf FAIR-Data aus. Die eingängige Abkürzung FAIR steht für Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel, kompatibel) und Re-usable (wiederverwendbar).

Findable

Um Daten auffindbar zu machen, müssen sie mit einem eindeutigem Identifikator, einem PID (persistent identifier), versehen sein. Zudem sollten die Metadaten maschinen-lesbar und auch für den Menschen gut verständlich sein.

Accessible

Daten sollten frei, d.h. online und ohne paywall, zugänglich sein. In der Praxis jedoch sind sind jegliche Daten, die Persönlichkeitsrechten, Copyrights oder speziellen Verträgen unterliegen, ausgenommen. In jedem Fall sollte definiert werden, welche Daten auf welche Art teilbar sind und welche geschützt werden müssen.

Interoperable

(Meta)Daten sollten mit unterschiedlichen Computersystemen kompatibel sein. Hierzu sollten offene und möglichst keine geschützten Formate verwendet werden. Ausserdem sollten die Metadaten die bereits etablierten Standards der jeweiligen Forschungsdisziplin widerspiegeln.

Reusable

Aus den Metadaten sollte klar hervorgehen, unter welchen Bedingungen die Daten genutzt werden dürfen.

Open Data

Daten uneingeschränkt zur Verfügung zu stellen (public domain) ist das universale Ideal von Open Data. Sie müssen maschinenlesbar sein und offene Dateiformate aufweisen. Angewandte Lizenzen dürfen keine einzelnen Gruppen von der Nutzung der Daten ausschliessen. Trotzdem: Open Data unterliegen dem Datenschutz und dürfen daher keine sensitiven Daten beinhalten. Die praktische Umsetzung von Open Data ist oft schwierig.