Aufgabe "Metadatenstandards"

Zuletzt aktualisiert am 2025-08-21 | Diese Seite bearbeiten

Metadaten sind Daten, die Informationen über andere Daten enthalten. Sie beschreiben die Struktur, den Inhalt und die Eigenschaften von Datensätzen.

Es gibt verschiedene Standards und Formate für Metadaten, die je nach Anwendungsfall variieren können. In dieser Aufgabe werden wir verschiedene Metadatenformate betrachten und diese mit Hilfe von KI ineinander umformen.

Citation File Format (CFF)


Das Citation File Format (CFF) ist ein Standard, der es ermöglicht, bibliografische Informationen über Softwareprojekte oder Datenarchive in einer einfachen menschen- und maschinenlesbaren Form zu speichern. Die explizite Spezifikation solcher Informationen ist für Software und Daten extrem wichtig, da sie sich i.d.R. nicht vom Endprodukt oder dem Inhalt der Resource ableiten lassen. Softwarerepositorien wie GitHub oder Datenrepositorien wie ZENODO unterstützen dieses Format, um die Metadaten zu den Projekten zu speichern und nutzerfreundlich Zitationsinformationen in unterschiedlichen Formaten bereitzustellen.

Aufgabe 1 - CFF Metadaten untersuchen

Die Datenbasis dieses Selbstlernmaterials ist ein GitHub Repository, in welchem auch Zitationsinformationen im CFF Format hinterlegt sind.

  • Besuchen sie das Repository https://github.com/Dr-Eberle-Zentrum/FDM-basics
  • Finden sie in der GitHub Oberfläche die von GitHub bereitgestellte Zitationsinformation (Menü im rechten Rand)
  • Erstellen sie eine Markdown-Datei
    • FDM-basics.Metadaten.md in ihrem Abgabeordner
    • und dokumentieren sie dort den aktuellen Stand:
      • die Zitationsinformationen im CFF Format (nutzen sie einen Codeblock in Markdown)
      • die Zitationsinformation im BibTeX Format

Aufgabe 2 - CFF Metadaten überarbeiten

CFF Dateien können auch von Menschen gelesen werden, da sie in einem YAML ähnlichen Format geschrieben sind. Sie können die Datei also auch in einem Texteditor öffnen und bearbeiten. Allerdings bietet es sich an, einen speziellen Editor zu verwenden, der die Syntaxprüfung und Validierung übernimmt. Im Folgenden sollen sie solch einen verwenden, um die Metadaten zu überarbeiten.

  • Öffnen sie den Online CFF Editor
  • Laden sie den CFF Eintrag aus dem Repositorium zum Editieren hoch
  • Prüfen und überarbeiten sie u.a.
    • Titel des Projekts
    • Autorenliste
    • Artifact repository (Basis-URL der erzeugten Selbstlernseiten wie in diesem Dokument)
    • Veröffentlichungsdatum auf das aktuelle Datum setzen
    • Version auf das aktuelle Semester setzen
    • Keyword Liste ergänzen bzw. überarbeiten
    • .. falls sie nicht wissen, was gewisse Punkte bedeuten, schlagen sie kurz in der CFF Spezifikation nach.
  • Speichern sie die überarbeiteten CFF Metadaten in der Datei FDM-basics.Metadaten.md in einem neuen Abschnitt ab.

Aufgabe 3 - CFF Metadaten in andere Formate umwandeln

Es gibt verschiedene Formate, in denen Zitationsinformationen bereitgestellt werden können. Die gängigsten sind BibTeX, RIS und JSON und hierfür gibt es auch Konverter, die die CFF Metadaten in diese Formate umwandeln können.

Allerdings möchten wir die Daten im allgemeinen Dublin Core Format bereitstellen, da dieses Format von vielen Repositorien und Bibliotheken unterstützt wird.

Um uns die Suche nach einem geeigneten Konverter zu ersparen, beschliessen wir, die Umwandlung mit Hilfe von KI Tools wie ChatGPT, Claude oder Microsoft Copilot durchzuführen.

ACHTUNG: Hierbei verschiebt sich jedoch ihre Rolle von der Erstellung von Inhalten hin zu einer Überprüfung der Ergebnisse, die die KI generiert. Also prüfen sie die Ergebnisse auf Vollständigkeit und Richtigkeit (und schlagen sie ggf. vorher nochmal kurz in der Dublin Core Format Zusammenfassung nach).

  • Verwenden sie einen KI Dienst ihrer Wahl, um die CFF Metadaten in Dublin Core Metadaten im XML Format umzuwandeln.
  • Standardmäßig unterstützt Dublin Core 15 unterschiedliche Metadaten-Elemente, welche teilweise auch mehrfach vorkommen dürfen
    • Prüfen sie, ob alle 15 Elemente in den Metadaten enthalten sind oder ob ggf. zusätzliche Elemente hinzugefügt werden könnten
    • Überprüfen sie, ob Mehrfachverwendungen von Elementen sinnvoll sind und ob diese korrekt umgesetzt wurden
    • ggf. benötigen sie den “Qualified Dublin Core” Standard, der zusätzliche Annotationen möglich macht
    • Stellen sie sicher, dass die Datei in einem validen XML Format vorliegt
  • Speichern sie die Dublin Core XML Metadaten in der Datei FDM-basics.Metadaten.md in einem neuen Abschnitt ab.
    • Dokumentieren sie auch die verwendete KI und was sie händisch nachgearbeitet haben.
    • Beschreiben sie (halbe Seite), wo sie an welche Grenzen gestoßen sind und welches Metadatenformat sie für mächtiger halten und warum.

Aufgabe 4 - Abgabedatei überarbeiten

Zum Schluss sollten sie (vor Abgabe) noch einen letzten Blick auf ihre Abgabedatei werfen und folgende Punkte prüfen:

  • Sind alle Metadaten in eigenen Code Blöcken in Markdown gesetzt, sodass sie nicht als Fließtext interpretiert werden?
  • Haben sie alle Abschnitte mit Überschriften versehen?
  • Fügen sie kurze Beschreibungen zu den Absätzen hinzu, was dort zu finden ist.

Alles ok? Na dann kann es ja losgehen mit der Abgabe! 👍