Achtung

Die Seite wird gerade noch überarbeitet. Bei auftretenden Problemen kontaktieren Sie uns bitte.

3.2 Project Overview

Wird OCR4all im Browser geöffnet, gelangt der Nutzer automatisch auf die Startseite „Project Overview“:

  • Settings“: Die Option „Settings“ dient dazu, jenes Werk auszuwählen, das im Folgenden bearbeitet werden soll. Dazu wird unter „Project Selection“ aus einer Dropdown-Liste das gewünschte Werk ausgewählt, welches zuvor als Ordner unter ocr4all/data/Werktitel angelegt wurde (s. 1.2). Zusätzlich erfolgt unter „Project image type“ die Auswahl von „Gray“.

Abb2.jpg

Abb. 2: Settings in der Project Overview.

  • Nach der Auswahl des Werks erfolgt das Laden des Werks über den Button „LOAD PROJECT“! Da von OCR4all bestimmte, festgelegte Dateibenennungen und -formate verlangt werden (0001.png usw.), kann der LOAD-Funktion die Aufforderung einer Konvertierung folgen. Diese kann direkt in OCR4all vorgenommen werden.

  • Hierbei ist es unerheblich, ob der 'input'-Ordner mit einem PDF oder mit Einzelbildern bestückt wurde. Wenn die Möglichkeit besteht, sind jedoch meist Einzelbilder zu bevorzugen.

Abb3.png

Abb. 3: Mögliche Datenkonvertierung. (Hier ein PDF im 'input'-Ordner)

  • In OCR4all werden alle während des Workflows und für dessen Funktionieren entstehenden Daten in einer einzigen PageXML-Datei pro Scanseite gespeichert und nicht mehr in Form vieler Einzeldateien vorgehalten. Sollten noch Projektdaten aus früheren Versionen vorhanden sein, besteht nun die Möglichkeit, das Projekt automatisiert in die von OCR4all geforderte Struktur zu konvertieren. Abb. 4: Mögliche Konvertierung eines Legacy-Projekts

  • Unter der Option „Overview“ kann nun jederzeit der tabellarisch geordnete, aktuelle Bearbeitungszustand des geladenen Werks eingesehen werden. Jede Seite des vorliegenden Werks erhält dazu als sog. „Page Identifier“ eine eigene Zeile, die darauffolgenden Spalten bilden von links nach rechts den typischen und vorgeschlagenen OCR4all-Workflow ab. Wurden bestimmte Arbeitsschritte des Gesamtworkflows durchgeführt, werden die entsprechenden Seiten im „Overview“ als bearbeitet (Haken) markiert. Über die Optionen „Show... entries“ und „Search“ können die Anzeige selbst verändert oder besonders umfassende Werke durchsucht werden!

Abb4.png

Abb. 4: Overview.

  • Durch einen Klick auf einzelne „Page Identifier“ können die Bearbeitungszustände einzelner Scanseite sowie die zu ihnen bereits vorliegenden Daten über den gesamten Arbeitsprozess hinweg eingesehen werden. Dazu dient die Spalte „Images“ sowie die zugehörigen Optionen „Original“, „Binary“, „Gray“ sowie „Noise Removal“.
  • Über den Button "Export GT" (oben rechts) können sämtliche im Rahmen des Projekts entstandenen Daten exportiert und als Zip-Ordner innerhalb von 'data' verpackt werden.