Import

Das Anlegen von Vorgängen kann über eine manuelle Datenerfassung erfolgen. Wesentlich einfacher ist jedoch der automatische Import von Metadaten aus anderen Systemen. Dabei kann nahezu jedes System über ein entsprechendes Plugin angebunden werden, wenn es maschinenlesbare Daten liefert. Hierfür stehen im Allgemeinen zwei unterschiedliche Arten von Plugins zur Verfügung:

Katalogplugins

Sei es der zentrale Bibliothekskatalog, das Findbuch im Archiv oder die Objektdatenbank im Museum. Über standardisierte Schnittstellen wie zum Beispiel z39.50, SRU oder OAI können Metadaten in beliebigen Formaten, unter anderem als MARCXML, Lido oder DublinCore, abgerufen und verarbeitet werden. Aber auch proprietäre Schnittstellen mit eigenen Formaten können hierbei Verwendung finden (z.B. XML über eine REST-Schnittstelle).

Import-/ Massenimportplugins

Oft stehen Metadaten samt digitaler Objekte als Ergebnisse früherer Projekte und in größerer Menge zur Verfügung. Oder es liegen Excel-Tabellen, CSV-Dateien zusammen mit besonderen Ordnerstrukturen, Microsoft Access Datenbanken oder sonstige Eigenentwicklungen in proprietären Formaten vor. Auch solche Daten sind für Goobi workflow kein großes Problem. Denn auch in solchen Fällen können die Daten mittels individueller Importplugins überführt und importiert werden.

Verarbeitung

Die Stärke von Goobi workflow liegt in der Verarbeitung und Steuerung von Workflows. Hierfür werden die gewünschten Arbeitsabläufe im Vorfeld in wiederholt anwendbaren Produktionsvorlagen hinterlegt. Eine solche Produktionsvorlage beschreibt jeweils eine beliebige Anzahl an Aufgaben, die wiederum einer zuvor festgelegten Reihenfolge unterliegen. Typische Beispiele für Produktionsvorlagen sind unter anderem diese:

  • Standardworkflow zur Digitalisierung und Veröffentlichung
  • Digitalisierung on Demand
  • Massenimport eines Altdatenprojektes

Auf der Basis einer solchen Produktionsvorlage wird für jedes zu digitalisierende Objekt in Goobi ein Vorgang angelegt. Dieser erlaubt anschließend eine Abarbeitung der Aufgaben, die aus der Produktionsvorlage übernommenen wurden. Jede dieser Aufgaben ist dabei mindestens einer Benutzergruppe oder einem Benutzer zugewiesen und erhält verschiedene Rechte, Funktionen oder Plugins für eine Datenverarbeitung und Validierung. Auf diese Weise wird unter anderem gesteuert, ob eine solche Aufgabe manuell durch einen Benutzer oder vollautomatisch durch den Server  ausgeführt wird.

Ein prototypischer Workflow für die Digitalisierung von Büchern kann z.B. aus den folgenden Aufgaben bestehen:

Aufgabe Typ Zuständigkeit Beschreibung
Anlegen des Vorgangs per Katalogabfrage Manuell Bibliothekare Überprüfung des Datensatzes im Katalog, Erzeugen eines Vorgangs durch automatische Datenübernahme aus dem Katalog
Scannen Manuell Scan-Operator Erzeugung der Digitalisate und Einspielen in Goobi workflow
Validierung der Images Automatisch Server Automatische Validierung der korrekten Farbtiefe, Auflösung und Dateibenennung
Qualitätskontrolle Manuell Quality Assurance Stichprobenhafte Überprüfung der Scanqualität hinsichtlich Vollständigkeit und Schärfe
Erzeugen von Derivaten Automatisch Server Automatische Erzeugung eines komprimierten Derivats neben den Master-Bildern
Struktur- und Metadatenerfassung Manuell Bibltiothekare Erzeugung einer Paginierung, Erzeugung von Strukturdaten, Anreicherung der Metadaten
OCR Generierung Automatisch Server Automatische Volltexterkennung und speichern als ALTO-Dateien
Generierung von Persistent Identifier Automatisch Server Automatische Generierung von persistenten Identifiern und Registrierung der Identifier bei einem Resolver
Export der Daten in den Goobi viewer Automatisch Server Automatische Veröffentlichung der Digitalisate samt Metadaten im Goobi viewer mit konfigurierten Zugriffsbeschränkungen
Anreichern der Master-Bilder um XMP-Metadaten Automatisch Server Automatische Anreicherung der Master-Bilder um XMP-Metadaten aus den Metadaten des Goobi Vorgangs
Ingest der Master-Bilder in ein Repository Automatisch Server Automatischer Ingest der Master-Bilder in ein Repository (z.B. Fedora)

Innerhalb von Goobi workflow werden die Workflows und die dazugehörigen Aufgaben folgendermaßen visualisiert:

Neben den Kernfunktionen von Goobi workflow stehen als Erweiterung eine Vielzahl unterschiedlicher Plugins zur Verfügung. So existieren derzeit insgesamt etwa 210 solcher Plugins verschiedener Typen. Projektmanager können etwa mit den Statistik- und Administrations-Plugins den genauen Verlauf des Projektes überwachen, auswerten und auch Reports generieren. Den Administratoren von Goobi workflow hingegen stehen mächtige Tools zur Seite, mit denen auf einfache Art- und Weise Massenmanipulationen an dem Datenbestand vorgenommen werden können.

Export

Am Ende eines Workflows steht im Allgemeinen der Export. Auch dieser ist plugingestützt. Typische Export-Plugins realisieren hierbei die Übergabe von Bildern und Metadaten standardisierten Formaten wie METS/MODS oder LIDO-Format an ein Präsentationssystem wie den Goobi viewer. Aber auch für andere Einsatzszenarien stehen Export-Plugins zur Verfügung, wie beispielsweise für das Generieren von PDF-Dateien und einen Emailversand mit Downloadlink oder auch für einen Ingest in ein Repository oder in ein Langzeitarchiv.