Textregionen
Version vom 27. März 2026, 15:53 Uhr von Fabian Peters (Diskussion | Beiträge)
Allgemein
Jede Seite besteht aus mehreren Strukturelementen. Das können Seitenzahl, Eintrag, Absätze, Überschriften, Tabellen etc. sein.
Für jedes dieser Elemente erstellen wir eine Textregion.
Strukturtypen
heading- Überschrift
paragraph- Absatz
paragraph-continued- Fortsetzung eines Absatzes der vorherigen Seite
marginalia- Marginalie/Randbemerkung
page-number- Seitennummer
signature-mark- Unterschriftenblock am Ende einer Sitzung (nicht innerhalb einer Randbemerkung).
- Damit entfällt die Notwendigkeit die Unterschriften als solche (per 'gez.' z. B.) zu markieren.
- Signature mark hat eigentlich eine speziellere Bedeutung.
- Da diese Textregion voreingstellt ist und die zentrale Verwaltung von Textregionen für alle Nutzer in der Desktopversion nicht möglich ist, haben wir sie für unsere Zwecke adaptiert.
Spezialfall: Tabelle
- Tabellen werden als speziell als Tabellenregion ausgezeichnet.
- Nach der initialen Markierung der Tabellenregion müssen die einzelnen Spalten und Zeilen durch vertikale und horizontale Schnitte in die Region eingepflegt werden.
Informationen zur Manuellen Layouterkennung auf transkribus.org
Wenn die Textregionen erfasst wurden können Sie zur Zeilenerkennung übergehen.