Nachdem bereits in zwei vorhergehenden Posts( https://jointly.info/2020/03/30/kontrollierte-vokabulare-wieso-weshalb-warum/, https://jointly.info/2020/04/27/erste-vokabulare-veroeffentlicht/) über kontrollierte Vokabulare gesprochen wurde, soll diese Reihe nun mit einem Bericht über weitere Einsatzmöglichkeiten von kontrollierten Vokabularen fortgesetzt werden.
Jöran Muuß-Merholz hat bereits auf mehreren OER-Veranstaltungen darauf hingewiesen, dass freie Bildungsmaterialien kein Qualitätsproblem, sondern eher ein Auffindbarkeitsproblem haben. Wie ist das gemeint? Freie Bildungsmaterialien sind auf vielen verschiedenen Plattformen verstreut. Sie werden von sehr engagierten Menschen mit viel Sorgfalt erstellt und unter einer freien Lizenz zur Verfügung gestellt, jedoch sind sie dann meist nur auf der Plattform, auf der sie erstellt wurden zugänglich. Dieses Problem wird von der Plattform http://wirlernenonline.de bearbeitet, indem die Metadaten der Materialien auf der Plattform durch Crawler eingesammelt werden und in einer übergreifenden Suche zur Verfügung gestellt werden.
Die bisher hinzugefügten Vokabulare haben dabei vor allem dem Zweck gedient, einerseits Repositoriumsbetreiber:innen zukünftig Wertelisten an die Hand zu geben, die sie bei der Bereitstellung ihrer Metadaten berücksichtigen können, andererseits wird Maschinen geholfen variierende Attributwerte eindeutig zuordnen zu können. Die Qualität der Metadaten wird also entweder vor dem Einlesen durch Crawler oder aber beim Einlesen verbessert.
Nachgelagerte Qualitätsverbesserung durch Sachgebiets- und Schlagwortsystematiken
Verbessert werden kann aber nur, was überhaupt ausgefüllt wurde. Leider weisen jedoch viele Materialien wenig bis keine Metadaten außer dem Titel des Dokuments, ein paar Schlagwörtern oder einer Beschreibung auf. Mit so wenig Daten ist eine gute Materialsuche schwierig zu gestalten. Im Rahmen eines gemeinsamen Brainstormings mit dem wirlernenonline-Team wurden dazu mögliche Lösungskonzepte erarbeitet. Dabei hat sich herausgestellt, dass die Vokabulare auch für eine nachgelagerte Qualitätsverbesserung genutzt werden können. Konkret heisst dies, dass die vorhandenen Daten mit den Vokabularwerten abgeglichen werden, um eine Qualitätsverbesserung zu erzielen. Wird beispielsweise „Übungsblatt“ in dem Titel oder den Schlagworten gefunden, kann daraus geschlossen werden, dass es sich beim sogenannten „Learning Resource Type“ (LRT, Art der Lernressource) um ein Übungsblatt handelt, da dieser Wert als Begriff in den kontrollierten Vokabularen vorkommt.
Da Lernmaterial oft über das Schulfach gesucht wird, ist auch die Verbesserung der Fachzuordnung wünschenswert. Hierbei kann ein ähnlicher Ansatz wie bei dem Learning Resource Type verfolgt werden, jedoch werden hier schnell Grenzen erreicht. Ein Material mit dem Titel „Quiz Biologie“ ist schnell dem LRT „Quiz“ und dem Fach „Biologie“ zugeordnet, jedoch sind die Materialien meist themenspezifischeer betitelt (was auch wünschenswert ist, da die Betitelung sonst doch recht allgemein wäre). So ist es aber schwierig aus dem Titel „Quiz Laubbäume“, das Fach Biologie zu schließen.
Um das zu ermöglichen, wurden Schlagwort- und Sachgebietssystematiken, die im Rahmen der AG MUD (Arbeitsgruppe der Länderkonferenz Medienbildung) entstanden sind in SKOS modelliert und stehen somit als kontrollierte Vokabulare zur Verfügung. Die Systematiken, die ursprünglich nur als rtf-Dateien oder Excel-Tabellen auf der Seite zum Download bereitstanden, wurden dazu konvertiert und in gut nachnutzbare sowie maschinenlesbare Turtle-Files umgewandelt. Mit Hilfe von Natural Language Processing (NLP) Methoden, kann somit aus „Bäume“ der Singular „Baum“ geschlossen und das Wort „Laubbaum“ dem „Fach“ Biologie zugeordnet werden.
Diese Art der nachgelagerten Qualitätsverbesserung durch den Einsatz von kontrollierten Vokabularen soll in einem Proof-Of-Concept in wirlernenonline erprobt werden. Jointly freut sich, dass es durch sein Know-How die nötigen Vokabulare befreien, konvertieren und maschinenlesbar zur Verfügung stellen konnte.