Der intranda OCR-Service besteht insgesamt aus mehreren Komponenten, die eine Volltexterkennung von Textmaterialen erlaubt. Ein Einsatz dieses Service ist dabei vollständig integriert in Goobi möglich. OCR wird vollautomatisch und im Hintergrund innerhalb des Workflows durchgeführt. Ein Betrieb des OCR-Service ist aber ebenfalls komplett ohne Einsatz von Goobi möglich. Erfahren Sie hier mehr über die Details des intranda OCR-Service und dessen Einsatzmöglichkeiten.
Integration in Goobi
Der OCR-Service kann vollständig in Goobi integriert werden. Dazu erfolgt eine Konfiguration des betreffenden Workflows für den jeweiligen Arbeitsschritt, so dass dem Service verschiedene Informationen zu dem gewünschten OCR-Ergebnis übermittelt werden. Dazu gehören unter anderem:
- Zu analysierendes Imageset (Masterimages, Derivate etc.)
- Verwendeter Schrifttyp (Antiqua, Fraktur)
- Verwendete Sprache des Materials
- Zielformat für das OCR-Ergebnis (PDF, TXT, DOC, TEI, ALTO, XML etc.)
- Priorität
Nachdem diese Parameter einmalig für den Workflow bzw. beim Hinzufügen von Bänden zu Goobi gesetzt wurden, erfolgt die Abarbeitung der Texterkennung vollautomatisch im Hintergrund, wenn der konfigurierte Status innerhalb des Ablaufs der Arbeiten erreicht wurde.
Integration in andere Software
Eine Integration des OCR Service in beliebige andere Software ist problemlos möglich. Über einfache Aufrufe eines Webservice oder aber über Aufrufe per plattformunabhängiger Kommandozeile kann eine Erkennung von Volltexten in jeder beliebigen Software realisiert werden. Eine automatische Batchverarbeitung zur Volltexterkennung großer Imagebestände steht somit jeder Software offen. Sprechen Sie uns einfach an.
Automatische Verarbeitung
Nachdem die einzelnen OCR-Aufträge durch die jeweilige Software, in die eine Volltexterkennung integriert wurde, erzeugt wurden, gelangen diese in die Warteschlange des OCR Service. Hierbei handelt es sich um eine Webanwendung für die Administration. Für den seltenen Fall, dass ein Eingriff in die Verarbeitungsreihenfolge erfolgen oder Einblick in das verarbeitete Volumen genommen werden soll, bietet sich hier die Möglichkeit einer Steuerung über einen beliebigen Webbrowser.
intranda OCR Service
- Flexibles OCR-Modul für Goobi & Co.
- Funktionalität und Integration des OCR-Service
- Formate und Sprachen
- Technische Details des OCR-Service
Systemvoraussetzungen
Betriebssystem: | Linux, Windows, Mac OSX |
Arbeitsspeicher: | 2 GB |
Prozessor: | 1 Kern |
Festplatte: | 200 MB für die Applikation plus Speicher für die Digitalisate |
Software beziehen
Dokumentation: | intranda TaskManager Handbuch hier herunterladen |
Installation: | Auf Anfrage |
Kommentarbereich geschlossen.