Textregionen
Zur Navigation springen
Zur Suche springen
Allgemein
Jede Seite besteht aus mehreren Strukturelementen. Das können Seitenzahl, Eintrag, Absätze, Überschriften, Tabellen etc. sein.
Für jedes dieser Elemente erstellen wir eine Textregion.
Informationen zur Manuellen Layouterkennung auf transkribus.org
Strukturtypen
heading- Überschrift
paragraph- Absatz
paragraph-continued- Fortsetzung eines Absatzes der vorherigen Seite
marginalia- Marginalie/Randbemerkung
page-number- Seitennummer
signature-mark- Unterschriftenblock am Ende einer Sitzung (nicht innerhalb einer Randbemerkung).
- Damit entfällt die Notwendigkeit die Unterschriften als solche (per 'gez.' z. B.) zu markieren.
- Signature mark hat eigentlich eine speziellere Bedeutung.
- Da diese Textregion voreingstellt ist und die zentrale Verwaltung von Textregionen für alle Nutzer in der Desktopversion nicht möglich ist, haben wir sie für unsere Zwecke adaptiert.
Wenn die Textregionen erfasst wurden können Sie zur Zeilenerkennung übergehen.
Spezialfall: Tabelle
- Tabellen werden als speziell als Tabellenregion ausgezeichnet.
- Nach der initialen Markierung der Tabellenregion müssen die einzelnen Spalten und Zeilen durch vertikale und horizontale Schnitte in die Region eingepflegt werden.