Anwendertreffen 2021: Virtuell am 24. und 25. November

Pandemiebedingt findet das Anwendertreffen virtuell über WebEx statt. Wir bitten um formlose Anmeldung bei der Geschäftsstelle unter contact@kitodo.org bis zum 19.11.2021.

An dem Programm können kurzfristig noch Änderungen vorgenommen werden.

Vor dem Anwendertreffen findet am 24.11.2021 von 09:00-10:30 Uhr die Mitgliederversammlung des Kitodo e. V. statt (nur für Vereinsmitglieder und angemeldete Gäste).

Programm 24.11.2021

Einwahldaten WebEx für diesen Tag:

11:00-11:30 Roland Roth-Steiner (ULB Darmstadt): Realisierung eines Kitodo.Production-Workflows auf Basis einfacher Shellscripte (Vortrag)

++ Dieser Vortrag muss leider kurzfristig entfallen. Wir beginnen dennoch um 11:00 Uhr, indem wir den zweiten Vortrag vorziehen. ++

Hier die Folien zum Vortrag.

In der ULB Darmstadt soll mittelfristig Kitodo als Digitalisierungsplattform eingesetzt werden und das bisherige System (dwork, UB Heidelberg) ablösen. Dazu wurden ein Kitodo.Production- und ein Kitodo.Presentation-Server aufgesetzt und - mit Unterstützung durch die Kitodo-Community und Dienstleister - grund-eingerichtet.

Da Kitodo.Production - Stand jetzt - aber keine Implementierung vieler Standard-Prozesse einer Digitalisierungsplattform mitbringt (außer dre Konvertierung Master -> Derivate), andererseits eine sehr solide Nutzer- und Prozessverwaltung etc. umfasst, mussten etliche Prozesse selbst realisiert werden, so z.B. die Validierung der Master-Bilder, die Erzeugung und Speicherung der URN und die Platzierung einer Fussleiste mit PURL, URN und Logo unter die JPG-Derivate.
Entwicklungs-Projekt waren die Hessischen Parlamentsprotokolle.
Verwendet wird Version 3.3 von Kitodo.Production und Kitodo.Presentation mit Typo3 mit Templates von Zeutschel.

11:00-11:30 11:30-12:00 Stefan von der Heide und Lutz Nahold (CCS): Cloutodo -- Kitodo.Production-Cloudlösung (Vortrag)

Hier die Folien zum Vortrag.

In Absprache mit dem Kitodo-Vorstand hat CCS die cloudbasierte Lösung CLOUTODO zur Digitalisierung von historischen Dokumentenbeständen entwickelt. CLOUTODO bietet Kund*innen die sinnvoll optimierte Nutzung von Kitodo.Production ohne die aufwendige Investition in eine kostenintensive IT-Infrastruktur und ist dadurch unmittelbar nutzbar.
Zusätzliche Vorteile auf einen Blick: automatische Layout- und Strukturanalyse, Digitalisate im METS/ALTO xml-Format, Langzeitarchivierung und Präsentation, OCR, volle Unterstützung des kompletten Digitalisierungs-Workflows. CLOUTODO ist somit eine cloudbasierte Kitodo.Production-Anwendung, perfekt ergänzt durch die Funktionalitäten der Software CCS docWorks.

11:30-12:00-13:00 Mittagspause

13:00-13:30 David Maus (SUB Hamburg): Von METS zu Manifest (Vortrag)

Hier die Folien zum Vortrag: https://doi.org/10.5281/zenodo.5724040

Das Internal Image Operability Framework (IIIF) entwickelt sich zu einem de facto-Standard für die Publikation von Bilddaten und Bildmetadaten im nationalen wie internationalen Kontext.

Die Kitodo-Community verfügt in Gestalt der METS-, MODS- und TEI-Anwendungsprofile für digitalisierte Medien über die besten Voraussetzungen, IIIF Manifeste als neues Metadatenformat zu bedienen.

Eine Möglichkeit, IIIF-Manifeste für unsere Digitalisate bereitzustellen, besteht darin, die benötigen Bildmetadaten durch eine dynamische Transformation zu erzeugen und über einen REST-Webservice auszuliefern.

In einem Vortrag von ca. 20 Minuten möchte ich diese Lösung für die Produktion von IIIF-Manifesten aus METS-Dateien und daraus an die METS-Dateien erwachsenden Ansprüche vor- und zur Diskussion stellen.

13:30-14:00 Erik Sommer und Robert Sachunsky (SLUB Dresden), Stefan Weil (UB Mannheim), Robert Strötgen (UB Braunschweig): Implementierungsprojekt Kitodo/OCR-D (Vortrag)

Hier die Folien zum Vortrag.

Kitodo ist mit Kitodo.Production und Kitodo.Presentation eine weit verbreitete und offene Lösung für die Massendigitalisierung in kulturgutbewahrenden Einrichtungen, die für große und kleine Institutionen passende Betriebsmodelle erlaubt. Das DFG-geförderte Projekt OCR-D hat sich zum Ziel gesetzt die automatischen Volltexterkennung in ihre einzelnen Prozessschritte zu zerlegen und als einzelne Open-Source-Komponenten bereitzustellen. Dies ermöglicht es, optimale Workflows für zu prozessierenden Drucke zu erstellen und damit wissenschaftlich verwertbare Volltexte zu generieren.

Ein auf den Werkzeugen und Workflows von OCR-D basierendes Verfahren zur Texterkennung muss deshalb als verteiltes System konstruiert werden, das der Flexibilität der verschiedenen Betriebsmodelle, der komplexen Workflows sowie der bedarfsgerechten Skalierbarkeit für kleine bis sehr große Digitalisierungsprojekte gerecht wird.

Im Vortrag wird das Projektvorhaben vorgestellt, das im Ergebnis den Einsatz von OCR-D in der Massendigitalisierung mit Kitodo ermöglichen soll.

14:15-16:30 Ekaterina Rykhlinskaya, Michael Kotzyba, Robert Strötgen (UB Braunschweig): Anforderungen und Rahmenbedingungen für den Einsatz von OCR-D in Kitodo (Workshop)

[Der Workshop baut auf den Informationen aus dem davor stattfindenden Vortrag (13:30-14:00 Uhr) auf!]

Die Integration von Kitodo und OCR-D ist ein von der DFG gefördertes Projekt zur Volltextverfügbarkeit für digitalisiertes Kulturgut. Ziel des Projektes ist die Entwicklung einer Lösung, bei der Kitodo mit OCR-D Texterkennung sowie mit den anderen OCR-D Diensten verbunden wird. Damit kann die Volltexterstellung bei der Digitalisierung von historischen Drucken automatisiert und beschleunigt werden.

Um die vielfältigen Anforderungen und Wünsche der AnwenderInnen bei der Entwicklung einzubeziehen, wollen wir die geplante Integration von OCR-D in diesem Workshop mit der Kitodo-Community gemeinsam besprechen und erarbeiten. Dabei werden Bedarf und Rahmenbedingungen der AnwenderInnen in Bezug auf Materialien, Infrastruktur, Geschäftsmodell usw. diskutiert. Unter anderem sollen die Fragen geklärt werden, welche Arten von Medien zu digitalisieren sind, wofür konkret OCR-D eingesetzt werden soll und wie die OCR-Einbindung im Kitodo-Workflow für die AnwenderInnen umgesetzt werden kann. In diesem Rahmen erstellen wir ebenfalls eine Umfrage, um die benötigten Anforderungen in kompakter Form sammeln zu können.

 

Programm 25.11.2021

Einwahldaten WebEx für diesen Tag:

09:00-09:30 Lilja Sautter und Jörg-Holger Panzer (SUB Göttingen), Triet Doan (GWDG): Projektvorstellung: OPERANDI - OCR-D Performance Optimisation and Integration. (Vortrag)

Hier die Folien zum Vortrag.

Ein gemeinsames Projekt der Niedersächsischen Staats- und Universitätsbibliothek (SUB) Göttingen und der Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG).

OPERANDI ist eines der Implementierungsprojekte, die im Rahmen der DFG-Initiative OCR-D gefördert werden. Das Hauptziel von OCR-D ist die konzeptionelle und technische Vorbereitung der Volltexttransformation der im deutschen Sprachraum erschienenen Drucke des 16.-18. Jahrhunderts. Die Aufgabe der automatischen Volltexterkennung wird in Prozessschritte zerlegt, die in der Open Source OCR-D-Software nachvollzogen werden können. Dies ermöglicht es, optimale Workflows für die zu prozessierenden und i.d.R. sehr heterogenen Vorlagen (Schrifttyp, Druck/Handschrift, Annotationen, Tabellen, Qualität, etc) zu erstellen und damit wissenschaftlich verwertbare Volltexte zu generieren.
Das Ziel von OPERANDI ist die Entwicklung und der Aufbau eines auf OCR-D basierenden Implementierungspaketes zur Massenvolltexterfassung mit verbessertem Durchsatz, bei besserer Qualität der Ergebnisse. Zugleich wird das Ziel verfolgt, dass das Implementierungspaket auch von anderen Vorhaben und Einrichtungen mit vergleichbaren Anforderungen nachgenutzt werden kann. Im Rahmen der Pilotierung wurden zwei Szenarien identifiziert. Im ersten Szenario soll die OCR-Erzeugung für bereits digitalisierte Werke stattfinden (Batch-Prozessierung), was in einer Massenvolltexterfassung mündet. Im zweiten Szenario erfolgt die OCR-Erzeugung für neue zu digitalisierende Werke durch Integration in den Digitalisierungsprozess (Integration).
Im Integrationsszenario wird die OCR-D Prozessierung als Workflowschritt der Digitalisierungsworkflowsoftware eingebettet, z.B. in Kitodo/Goobi. Die Digitalisierungsworkflowsoftware übergibt Objektbeschreibung (METS) und Bilder an einen Staging-Storage und eine Jobbeschreibung an den OPERANDI Service. Der Prozessierungsstatus kann von der Digitalisierungsworkflowsoftware abgerufen werden. Nach erfolgreichem Abschluss stehen die angepasste Objektbeschreibung und die Ergebnisse der Volltexterzeugung im Staging-Storage zur Verfügung. Im Fehlerfall kann eine Fehlerbeschreibung in der Digitalisierungsworkflowsoftware angezeigt werden. Abschließend kann die Digitalisierungsworkflowsoftware einen Archivierungsschritt (OLA-HD) durchführen.

09:30-10:00 Wito Böhmak (Sorbisches Institut Bautzen): Wie kommen die Metadaten zum Bild?
Einsatz von Kitodo.Production 3.2 bei der Digitalisierung eines Nachlasses - ein Werkstattbericht (Vortrag)

Hier die Folien zum Vortrag.

Im Rahmen eines DFG/LIS-geförderten Projekts zur Digitalisierung und Erschließung archivalischer Quellen setzt das Sorbische Institut Kitodo.Production 3.2 als Workflowsystem im Digitalisierungsprozess ein.
Ziel des Digitalisierungsprojekts ist die vollständige (Bild-)Digitalisierung des schriftlichen Nachlasses (Manuskripte, Korrespondenz, Zettelsammlungen) von Gotthold Schwela (1873-1948), die Tiefenerschließung im Kalliope-Verbund – dem Erschließungssystem für Autografen und Nachlässe, sowie schlussendlich die Zusammenführung der (Bild-)Digitalisate und der Erschließungsdaten, und die Anordnung der entstehenden digitalen Objekte (pro Akte) in der entsprechenden Tektonik.
Der entstehende digitale Nachlass (Abschluss zum 2.Q.2022) soll sowohl über Kalliope, später auch über Archiv-D, sowie das eigene Wissensportal sorabicon.de zugänglich sein.
Der Vortrag geht auf die Herausforderungen beim initialen Einsatz von kitodo.production 3.x und eines Neuprojektes (keine Datenmigration), dem Zusammenspiel mit dem externen Erschließungssystem Kalliope, sowie der visuellen Zugänglichmachung durch den DFG-Viewer Webdienst ein – das alles betrachtet vor dem Hintergrund des Wissensaufbaus durch erste Erfahrungen mit Version 2.1, dem Besuch von Weiterbildungsveranstaltungen, der Nutzung von Online-Tutorials und heterogener Dokumentation.
Ein Aspekt der Datenverarbeitung soll im Vortrag speziell erwähnt sein – der „Datenfluss“ der Erschließungs-/Metadaten durch den Workflow und die entsprechenden Konfigurationen dazu:  d.h. von der „hauseigenen“ Bezeichnung (0) hin zur Erfassung in Kalliope (1), die Übernahme in das kitodo.production System mittels SRU-Schnittstelle/EAD/MODS und mods2kitodo Stylesheet (2), die Deklaration im spezifischen kitodo.production Regelsatz und die Erfassung im internen METS (3), dem Export mittels Stylesheet in das METS/MODS-Format des digitalen Objektes (4) und die Benennung im DFG-Viewer (5).

10:00-11:00 Michael Kotzyba, Robert Strötgen (UB Braunschweig): Migration von Kitodo 2.x auf 3.x an der Universitätsbibliothek Braunschweig (Vortrag)

Hier die Folien zum Vortrag.

Der Beitrag stellt den Prozess der Migration des bis August 2021 an der UB Braunschweig produktiv eingesetzten Kitodos in der Version 2.2.0 auf die aktuelle Version 3.3.1. vor --  einschließlich notwendiger Vorbereitung, Durchführung, Nachbereitung sowie dabei aufgetretene Problemen und deren konkrete Lösung. Weiter wird eine kurze Übersicht bzgl. Kitodo 3.x aus Administrator- und Anwendersicht gegeben. Konkret beinhaltet der Praxisbericht folgende Themen:

Überblick:

  • Administrator- und Anwender-Sicht

Vorüberlegungen und Vorbereitungen:

  • Erstellung einer Testumgebung: (Neu-)Installation auf VM und/oder Online-Testsystem
  • Kitodo-System-Klon
  • Regelsatz konvertieren und anpassen
  • Workflows: Sichtung und Zusammenführung
  • Anbindung an eigenen Katalog via SRU und Erstellung der METS-Datei
  • Datenbank aufbereiten: XStream konvertieren, Mehrbändigkeiten vereinheitlichen, Aufgaben eine Rolle zuweisen, DB-Test-Migration

Durchführung:

  • Server Upgrade
  • Datenbank Konvertierung
  • Kitodo Software Installation
  • Anpassung der Nutzerrechte mit LDAP
  • Meta-Daten Konvertierung und Projekt-Indexierung
  • Erstellung der Workflows und migrieren serieller Publikationen

Nachbereitung:

  • Projekteinstellungen anpassen, Bild-Ordner und -Derivate erstellen
  • Einzelne Projekte nach bzw. erneut migrieren
  • Versionsupgrade auf 3.4.0

11:15-13:15 Michael Kotzyba, Robert Strötgen (UB Braunschweig): Migration von Kitodo 2.x auf 3.x an der Universitätsbibliothek Braunschweig (Workshop)

[Der Workshop baut auf den Informationen aus dem davor stattfindenden Vortrag (10:00-11:00 Uhr) auf!]

Der Workshop geht auf einige im Praxisbericht angesprochene Herausforderungen im Detail ein. Dabei wird zwar eine vorgeschlagene Themenliste bereitgestellt (siehe unten); den Teilnehmer*innen
soll aber auch die Möglichkeit gegeben, sich über konkrete Fragen und Punkte in deren jeweiligen lokalen Systemen auszutauschen, um gemeinsam mögliche Wege für eine Migration zu erarbeiten.
Themenliste als Vorschlag (ggf. via online-vote zu priorisieren):

  • Unterschiede zwischen Kitodo 2.x und 3.x
  • Erzeugen und Aktualisieren eines Kitodo System Klons
  • Regelsatz erstellen und Meta-Daten Konvertierung vorbereiten
  • Nutzerverwaltung mit LDAP + Zugriff auf Homeverzeichnis via SAMBA
  • Import: Katalog und Titeldaten via SRU (Pica+ und Marc)
  • Workflows (mit Skripten), Produktionsvorlagen und Laufzettel
  • Kitodo- und individuelle Bash-Skripte
  • Projekteinstellungen
  • Export: METS-Datei für MyCore, DFG-Viewer und andere (aktuell kein Kitodo.Presentation)
  • Extrabehandlung von Zeitungsvorgängen (nicht an UBBS nötig)