Textregionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen

Allgemein

Jede Seite besteht aus mehreren Strukturelementen. Das können Seitenzahl, Eintrag, Absätze, Überschriften, Tabellen etc. sein.

Für jedes dieser Elemente erstellen wir eine Textregion.

Informationen zur Manuellen Layouterkennung auf transkribus.org

Strukturtypen

heading
Überschrift
paragraph
Absatz
paragraph-continued
Fortsetzung eines Absatzes der vorherigen Seite
marginalia
Marginalie/Randbemerkung
page-number
Seitennummer
signature-mark
Unterschriftenblock am Ende einer Sitzung (nicht innerhalb einer Randbemerkung).
Damit entfällt die Notwendigkeit die Unterschriften als solche (per 'gez.' z. B.) zu markieren.
Signature mark hat eigentlich eine speziellere Bedeutung.
Da diese Textregion voreingstellt ist und die zentrale Verwaltung von Textregionen für alle Nutzer in der Desktopversion nicht möglich ist, haben wir sie für unsere Zwecke adaptiert.


Wenn die Textregionen erfasst wurden können Sie zur Zeilenerkennung übergehen.

Spezialfall: Tabelle

  • Tabellen werden als speziell als Tabellenregion ausgezeichnet.
  • Nach der initialen Markierung der Tabellenregion müssen die einzelnen Spalten und Zeilen durch vertikale und horizontale Schnitte in die Region eingepflegt werden.