Achtung

Die Seite wird gerade noch überarbeitet. Bei auftretenden Problemen kontaktieren Sie uns bitte.

1. OCR4all

1.1 Einführung

OCR4all ist eine Software, die zur digitalen Texterschließung vornehmlich sehr früh gedruckter Werke entwickelt wurde, deren aufwendige Drucktypen und oft uneinheitliche Layoutkonzeption die Erkennungsmöglichkeiten vieler anderer Texterkennungsprogramme übersteigen. Verständlich und selbstständig anwendbar spricht der in OCR4all vorgeschlagene Workflow unter anderem auch einen dezidiert nicht-informatisch vorgebildeten Nutzerkreis an und kombiniert unterschiedliche Arbeitswerkzeuge und Tools innerhalb einer einheitlichen Benutzeroberfläche. Der ständige Wechsel zwischen unterschiedlichen Programmen ist auf diese Weise nicht mehr nötig. Von der Vorverarbeitung der zur bearbeitenden Bilddateien (sog. Preprocessing) über die Layoutsegmentierung (sog. Region Segmentation mit LAREX), die Extrahierung der klassifizierten Layoutregionen und Zeilensegmentierung (Line Segmentation) und Texterkennung (Recognition) bis hin zur Korrektur der erkannten Texte (Ground Truth Production) und der Erstellung werkspezifischer OCR-Modelle in einem Trainingsmodul beschreibt OCR4all einen vollwertigen OCR-Workflow (s. Abb. 1).

Abb1.png

Abb. 1: Hauptkomponenten des OCR4all-Workflows.

V. a. durch die Möglichkeit der Herstellung und des Trainings werkspezifischer Texterkennungsmodelle, die sich dann theoretisch immer auch auf andere Drucke anwenden lassen, können mit OCR4all bei so gut wie allen gedruckten Texten sehr gute Ergebnisse in der digitalen Texterschließung erzielt werden. Mit Blick auf diese Gesamtkonzeption gibt die vorliegende Anleitung einen ausführlichen und detaillierten Einblick in die Arbeit und Einsatzmöglichkeiten von OCR4all im Rahmen der OCR besonders früher Drucke. Während in Kapitel 1 die allgemeine Einrichtung und Ordnerstruktur erläutert wird, behandelt Kapitel 2 einen empfohlenen Vorverarbeitungsschritt von Scans und Bilddateien außerhalb von OCR4all, der zu einer Verbesserung von Ergebnissen und Erleichterung der Arbeitsschritte innerhalb von OCR4all führt. Kapitel 3 behandelt das Starten von OCR4all sowie eine Übersicht der grundlegenden Funktionen. Das daran anschließende Kapitel 4 führt dann detailliert durch die unterschiedlichen und aufeinander aufbauenden Teilmodule des oben beschriebenen OCR- Workflows und stellt die eigentliche Bearbeitung von Drucken und Erstellung von OCR-Texten praktisch vor. Das abschließende Kapitel 5 widmet sich den aktuell häufigsten Benutzerproblemen.