Textregionen

Aus Consilium Communis Neuss
Version vom 10. Juli 2024, 10:11 Uhr von Fabian Peters (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Allgemein

Jede Seite besteht aus mehreren Elementen. Das können Seitenzahl, Eintrag, Absätze, Überschriften, Tabellen etc. sein.

Für jedes Element wird eine Textregion erstellt.

Innerhalb eines Eintrags gibt es (meistens) mehrere Textregionen = Absätze, die in den Metadaten als "Paragraph" ausgezeichnet werden.

Überschriften werden als eigene Textregion erfasst und in den Metadaten als "Heading" ausgezeichnet.

Marginalien (die kleinen Texte, die in manchen Bänden noch am Rand stehen) werden als "marginalia" ausgezeichnet.