Flexibles OCR-Modul für Goobi und andere Tools?
Antiqua oder Fraktur? Deutsch oder Englisch? Oder Spanisch, oder Italienisch… ?
Nutzen Sie alle Optionen. Über unseren OCR Service steuern Sie die Texterkennung vollautomatisch, selbst für größte Seitenvolumen und erhalten Ihre gewünschten Ergebnisse für jedes Material und in jedem erdenklichen Format.
Seit 2010 stellt intranda seinen Kunden ein OCR-Modul zur Verfügung, das direkt aus Goobi eine OCR-Texterkennung starten kann. intranda hat dabei in den letzten Jahren zahlreiche Erfahrungen mit verschiedener OCR-Verarbeitung in unzähligen Digitalisierungsprojekten gesammelt. In dieser Zeit haben wir unsere OCR-Services auf unterschiedlichen Engines wie Recognition Server, dem Tesseract Server sowie mittlerweise auf einer eigenen Implementierung auf Basis von OCR SDKs betrieben und verwertet.
Unser OCR-Service ist ein generischer Webservice, der als ein vollautomatisch ablaufender Arbeitsschritt unmittelbar in den Workflow von Goobi integriert werden kann. Darüber hinaus lässt sich dieser Service auch vollkommen unabhängig von Goobi aus jeder beliebigen anderen Software heraus aufrufen. Hierfür besteht lediglich die Unterstützung von Java als Softwarevoraussetzung.
Der intranda OCR-Service wurde zunächst in enger Zusammenarbeit mit dem Gemeinsamen Bibliotheksverbund (GBV) und der University Library of Southampton konzipiert und über die Jahre weiter optimiert. Die Abarbeitung der einzelnen OCR-Jobs erfolgt dabei nach frei definierten Prioritäten. Der jeweilige aktuelle Status eines jeden OCR-Jobs kann über ein Webinterface eingesehen sowie gesteuert werden. Als Ausgabeformate werden dabei sämtliche verbreiteten Formate und Sprachen unterstützt.
Sie möchten aus Ihren Digitalisaten einen Mehrwert generieren? Egal ob für eine Volltextsuche oder gar eine semantische Analyse, eine Texterkennung ist hierfür Voraussetzung. Nutzen Sie unseren OCR Service und Sie erhalten die besten Erkennungsraten bei zugleich unschlagbarem Seitenpreis.
Nutzen Sie alle Optionen, die der Marktführer für Texterkennung anbietet. Über unseren OCR Service steuern Sie die Texterkennung vollautomatisch selbst für größte Seitenvolumen und erhalten Ihre gewünschten Ergebnisse für jedes Material und in jedem erdenklichen Format. Gehen Sie keine Kompromisse ein.
Der OCR Service ist nicht nur für Digitalisierungsprojekte. Er lässt sich auch vollständig in Ihre tägliche Arbeit einbinden – egal wie Sie arbeiten. Er ist integrierbar in Workflowtools wie Goobi, lässt sich aber auch aus jeder anderen Software heraus steuern. Ein einfacher Kommandozeilenaufruf genügt für die Übergabe an unseren Webservice. Ein Betrieb ist auch auf Ihren Systemen unproblematisch und sofort möglich.
intranda OCR Service
- Flexibles OCR-Modul für Goobi & Co.
- Funktionalität und Integration des OCR-Service
- Formate und Sprachen
- Technische Details des OCR-Service
Systemvoraussetzungen
Betriebssystem: | Linux, Windows, Mac OSX |
Arbeitsspeicher: | 2 GB |
Prozessor: | 1 Kern |
Festplatte: | 200 MB für die Applikation plus Speicher für die Digitalisate |
Software beziehen
Dokumentation: | intranda TaskManager Handbuch hier herunterladen |
Installation: | Auf Anfrage |
Kommentarbereich geschlossen.