Rufen Sie uns an: +49 (0)551 291 76 100 oder schreiben Sie uns: info@intranda.com

Release Notes: Goobi 1.8.

Open Source Workflow Software.

intranda GmbH / Digitalisierung / Goobi / Goobi Release Notes / Release Notes: Goobi 1.8

Allgemeine Erweiterungen

Plugin-Schnittstelle

Es wurde eine Plugin-Schnittstelle entwickelt, die an verschiedenen Stellen Verwendung finden wird. Dadurch sind nun einfacher einrichtungsspezifische Änderungen in verschiedenen Bereichen von Goobi möglich, ohne den Kern der Anwendung ändern zu müssen. Stattdessen werden lediglich spezielle Plugins für einzelne Goobi-Anwender installiert.

Hotfolder-Mechanismus

Für einen möglichst vollautomatischen Import wurde ein Hotfolder-Mechanismus implementiert, der eine Übernahme von Metadaten und ein Erzeugen von Goobi-Vorgängen erlaubt. Basierend auf einer eigenen Konfigurationsdatei kann ein solcher Import durch das Einfügen von Metadatendateien in ein konfiguriertes Verzeichnis automatisch stattfinden.

Achtung: Im Rahmen der Entwicklungen der Version 1.9 wurde dieser Hotfolder-Mechanismus wieder entfernt und durch einen verbesserten Import-Mechanismus auf Plugin-Basis ersetzt.

Massenimport für bibliographische Daten

Basierend auf der Plugin-Schnittstelle wurde ein dynamisch erweiterbarer Mechanismus für den Import verschiedenster Metadaten implementiert. Abhängig von der Implementierung der jeweiligen Plugins werden diese im Bereich des neu geschaffenen Massenimports zu den jeweiligen Vorgangsvorlagen aufgelistet. Sie erlauben den Upload oder auch das Einfügen von Identifiern oder Metadaten in der Oberfläche von Goobi und führen den Import der Daten sowie das Erzeugen von Goobi-Vorgängen vollautomatisch automatisch durch. Die Plugins können jederzeit zur Laufzeit der Anwendung gegen andere Versionen ausgetauscht werden, ohne Goobi neu starten zu müssen. Jedes Import-Plugin, das in Goobi verwendet werden soll, muss an einer definierten Stelle innerhalb des Goobi-Hauptverzeichnisses liegen. Sämtliche Import-Plugins liegen gemäß der Goobi-Konvention an folgender Stelle im Dateisystem:

/opt/digiverso/goobi/plugins/import/

Jedes einzelne Plugin kann dabei als einzelnes *.jar kompiliert vorliegen. Auch können mehrere Plugins zusammen in ein *.jar kompiliert und Goobi zur Verfügung gestellt werden.

/opt/digiverso/goobi/plugins/import/MySingleImportPlugin.jar
/opt/digiverso/goobi/plugins/import/MyMultiImportPluginCollection.jar

goobi_history_soton_import

Verbesserte Backup-­Funktionalität

Die Erstellung der Backups der Mets-Dateien wurde überarbeitet. Die Zählung der erstellten Backups sowie die Vollständigkeit wurde sichergestellt und vermeidet künftig Missverständnisse über die vorgehaltenen Backup-Dateien und deren Benennungen.

Command-Line Verbesserungen

Zusätzlich zu den bestehenden Befehlen der Komandozeilenversion von Goobi wurden einige weitere Befehle für den Aufruf von externen Programmen ergänzt.

Achtung: Im Rahmen der Entwicklungen der Version 1.9 wurde dieser Command-Line-Modus von Goobi entfernt und durch einen verbesserten Web-API- Mechanismus auf Plugin-Basis ersetzt.

Batch-Import für MARC21

Im Rahmen mehrerer Projekte wurde ein Import-Plugin für den Massenimport von Dateien im Format Marc21 implementiert. Es steht nach der Installation für alle Workflowvorlagen zur Verfügung.

Unterstützte Importtypen:

Record: Plaintext MARC21 Datensätze (mehrere Datensätze in einer Datei möglich)
File: *.mrc Dateien (wie sie z.B. von MarcEdit generiert werden)

Batch-Import für Pica+/Pica3

Im Rahmen mehrerer Projekte wurde ein Import-Plugin für den Massenimport von Dateien im Format Pica+/Pica3 implementiert. Es steht nach der Installation für alle Workflowvorlagen zur Verfügung.

Unterstützte Importtypen:

Record: Plaintext PICA Datensätze (mehrere Datensätze in einer Datei möglich)

Batch-Import für PPN-Listen

Im Rahmen mehrerer Projekte wurde ein Import-Plugin für den Massenimport von Daten implementiert, die aus einem Pica-Katalog abgefragt werden sollen. Hierzu wird innerhalb der Weboberfläche des Plugins eine Liste von PPNs eingetragen, die anschließend aus dem Katalog importiert werden sollen. Das Plugin steht nach der Installation für alle Workflowvorlagen zur Verfügung.

Unterstützte Importtypen:

ID: Einfügen von mehreren Identifiern mit Zeilenumbrüchen voneinander getrennt

Batch-Import für Mods

Im Rahmen mehrerer Projekte wurde ein Import-Plugin für den Massenimport von Dateien im Format MODS implementiert. Es steht nach der Installation für alle Workflowvorlagen zur Verfügung.

Unterstützte Importtypen:

File: MODS-xml- Dateien

UCC Kompatibilität

Im Rahmen der Etablierung des universellen Capturing Clients, der zugleich einen alternativen Metadateneditor für Goobi darstellt, wurde eine Funktionalität implementiert, die eine unmittelbare Kommunikation mit Goobi erlaubt. Hierüber ist eine direkte Zusammenarbeit von Scan-Operatoren und den Goobi-Upload-Mechanismen gewährleistet.

Web-API

Basierend auf der Kommandozeilenversion von Goobi wurde eine Webschnittstelle implementiert, die externe Aufrufe von Goobi-Befehlen über URLs erlaubt. Sämtliche Kommandozeilenbefehle stehen in der Web-API zur Verfügung. Zur Absicherung des Datenbestandes können die einzelnen Befehle individuell auf spezielle IPs oder IP-Bereiche eingegrenzt werden.

Beispielaufruf:

http://intranda.com/goobi/wi?command=myCommand&token=mySecretPassword

Verbesserung der Statistik-Funktionalität

Es wurden einige Verbesserungen der statistischen Abfragen implementiert, so dass die generierten Ergebnisse besser nachgenutzt werden können. Dies betrifft in erster Linie Überschriften und Beschriftungen in den Diagrammen, aber auch die Möglichkeit Daten von generierten Tabellen als Excel-Dateien herunterladen zu können.

Encoding Verbesserungen innerhalb der Metadaten und bei PICA-Importen

Die Verarbeitung von Metadaten wurde in Goobi speziell für den Umgang mit Pica-Datensätzen verbessert. Die Maskierung von Sonderzeichen aus Pica-Katalogen wurde hierfür geprüft und für die weitere Verarbeitung optimiert.

Doppelte Seitenzuweisung von Unterelementen behoben

Bei der Seitenzuweisung zu Strukturelementen traten teilweise Mehrfachzuweisungen auf. Diese wurden nun geprüft und optimiert, so dass solche doppelten Zuweisungen nicht mehr auftreten können.

Allgemeine Optimierungen

Es wurden an verschiedenen Stellen Optimierungen vorgenommen, die eine Verbesserung der Performance der Anwendung erlauben. Dazu gehört neben allgemeinen Code-Optimierungen auch ein verbessertes Speichermanagement.

Formate

ALTO als OCR-Format

Innerhalb der vollautomatischen OCR-Verarbeitung wurde das Format ALTO nun für die weitere Verarbeitung berücksichtigt. Abhängig von der verwendeten OCR-Engine findet nun eine Übergabe der OCR-Ergebnisse als ALTO Verwendung und wird innerhalb des Exportes an das Präsentationssystem (z.B. Goobi viewer) ebenfalls berücksichtigt.

TEI als OCR-Format

Innerhalb der vollautomatischen OCR-Verarbeitung wurde neben ALTO das Format TEI nun ebenfalls für die weitere Verarbeitung berücksichtigt. Abhängig von der verwendeten OCR-Engine findet nun eine Übergabe der OCR-Ergebnisse auch als TEI Verwendung und wird innerhalb des Exportes an das Präsentationssystem (z.B. Goobi viewer) berücksichtigt.

nach oben