Tags/Markierungen
Die verschiedenen Auszeichnugsarten in Transkribus auf einen Blick
Inhaltsverzeichnis
Was sind "Tags"?
Neben der Transkription verfolgen wir in transkribus auch das Prinzip der "Textauszeichnung" mittels sogenannter "tags". Das sind "Etiketten, die man an Textabschnitte anheftet und mit weiteren Informationen versehen kann. Dadurch können wir unsere Texte genauer und informationsreicher machen.
Textstruktur
(Link zu einer neuen Anleitung für Textregionen folgt)
Jede Seite besteht aus mehreren Elementen. Das können Seitenzahl, Überschriften, Absätze, Marginalien, Tabellen etc. sein.
Für jedes Element wird eine Textregion erstellt.
Jeder Absatz (Sinnabschnitt eines Textes) ist eine eigene Textregion und wird in den Metadaten als "paragraph" ausgezeichnet.
Überschriften werden als eigene Textregion erfasst und in den Metadaten als "heading" ausgezeichnet.
Marginalien (die kleinen Texte, die in manchen Bänden noch am Rand stehen) werden als "marginalia" ausgezeichnet.
Die Textregion am Ende einer Sitzung, die die Signaturen der Stadträte enthalten, werden als "signature mark" ausgezeichnet
Textinhalt
Phänomen | Tag/Markierung | Eigenschaft | Bemerkung |
---|---|---|---|
Unklarheiten in der Transkription | unclear | ||
Person | person | key | Den Wert von key entnehmen Sie der Google-Tabelle. Mehr dazu unter: Register. |
Ort | place | key | siehe oben |
Beruf/Amt | occupation | key | siehe oben |
Organisation/Institution | organization | key | siehe oben |
aufgelöste Abkürzung | expan | Es lohnt sich, hierfür einen shortcut anzulegen | |
Datumsangabe | date | day / month / year | |
hochgestellter Text | seg | rend | Der Wert von rend (= rendition = Ausführung) sollte "superscript" sein |
durchgestrichener Text (auch: überschriebener Text) | seg | rend | Der Wert von rend (= rendition = Ausführung) sollte "strikethrough" sein |
unterstrichener Text | seg | rend | Der Wert von rend (= rendition = Ausführung) sollte "underline" sein |
zentrierter Text | hi | rend | Der Wert von rend (= rendition = Ausführung) sollte "center" sein |
Verschreibung im Originaltext | sic | correction | Wenn der Schreiber des Origiantexts sich verschrieben hat, transrkribieren sie das Wort so, wie es geschrieben wurde und markieren es mit sic.
Der Wert von correction ist die korrekte Schreibweise des Wortes. |
Hinweise
- Immer wiederkehrende Textbausteine wie Unterstreichungen von Eintragsüberschriften müssen nicht markiert werden.
- Das allgegenwärtige "a.u.s." muss nicht aufgelöst werden.
Sitzungen & Einträge
Wir unterscheiden zwischen sitzungsspezifischen Inhalten und Einträgen (die einzelnen Sachthemen, die während einer Sitzung des Stadtrats verhandelt wurden). Dabei handelt es sich um übergeordnete Strukturen, die in der Regel mehrere Textregionen umfassen.
Die alte Praxis sah nur die Markierung von Einträgen vor. Das führte dazu, dass das sitzungsspezifische Prozedere am Anfang und Ende eines Sitzungsprotokolls jeweils dem ersten und letzten Eintrag zugeschlagen wurde.
Damit wir die unterschiedlichen Abschnitte für die spätere Darstellung der Protokolle identifizieren können, verwenden wir das tag "gap" am Anfang der entsprechenden Abschnitte.
Vermeiden Sie dabei, dass diese Markierungen in anderen Markierungen wie person oder date stehen. Setzen Sie in diesen Fällen ein Leerzeichen dazwischen (siehe unten Beispiel 5, Zeile 8-1).
Abschnitt | Tag/Markierung | Eigenschaft | Bemerkung |
---|---|---|---|
Sitzung | gap | resp & type | Dieses tag markiert den Anfang eines Sitzungsprotokolls. Ihm folgen sitzungsspezifische Inhalte. Das ist in der Regel die Sitzungsüberschrift mit Datum. Dazu gehören aber auch Anwesenheitsliste, Abwesenheitsliste und sonstige Informationen zur Sitzung und den Sitzungsbeteiligten.
Der Sitzungsanfang muss ein als date markiertes Datum enthalten. Der Wert von resp ist das Namenskürzel der BearbeiterInnnen, die den Abschnitt erfasst, transkribiert und ggf. überarbeitet haben. Mehrere Kürzel werden mit einem Leerzeichen getrennt. Bsp: "PaSa JeCl". Hinweis: Diese Kürzel werden, in der veröffentlichten Präsentation, zu den Klarnamen aufgelöst und am Seitenfuß unter "Bearbeitende" angezeigt. Der Wert von type ist "session". Manchmal gibt es Sitzungen, die nach einer Pause fortgesetzt wurden. Eine Überschrift wie "post prandium" oder "post meridiem" leitet die Fortsetzung ein. Behandeln Sie diese Überschrift wie eine normale Sitzungsüberschrift und setzen Sie entsprechend gap_session ein. Der Inhalt muss dabei als date ausgezeichnet werden. |
Eintrag | gap | resp | Dieses tag markiert den Anfang eines Eintrags. Einträge sind die einzelnen verhandelten Inhalte im Protokoll einer Stadtratssitzung. Bsp: Rechnungsrevision, Antrag, Einstellung eines Lehrers uvm. Ein Eintrag beginnt oft mit einer Marginalie/Randbemerkung oder einer Überschrift.
Der Wert von resp wie oben. Der Wert vom type muss im Falle von Einträgen nicht ausgefüllt werden. > Durch die Markierung von Sitzungen mit gap_session ist die alte Praxis, am Anfang eines jeden Eintrags ein datums-tag mit dem Sitzungsdatum als Wert einzutragen, obsolet geworden! Alle mit gap markierten Einträge können in der anschließenden Weiterverarbeitung automatisch der Sitzung zugeordnet werden. |
sitzungsspezfische Inhalte am Ende einer Sitzung | gap | resp & type | Dieses tag markiert den Anfang der sitzungsspezfischen Inhalte am Ende eines Sitzungsprotokolls. Bsp: Schlussformeln, Unterschriften der Stadträte etc. Wenn solche Inhalte im Sitzungsprotokoll nicht vorkommen, brauchen sie das tag nicht.
Der Wert von resp wie oben. Der Wert von type ist "closer". Zusätzliche Hinweise:
|
Beispiele
Die folgenden Beispiele mit gap_session und gap_closer sind veraltet. Sitzungen, Einträge und Sitzungsabschlüsse werden nur noch mit gap markiert und die Eigenschaft "type" wird, wie oben beschrieben, mit entsprechenden Werten ausgefüllt. Zur Illustration wie Sitzungsanfänge, Einträge und Sitzungsabschlüsse aussehen können, bleiben die Bilder vorerst erhalten.