Exportworkflow
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
Inhaltsverzeichnis
Kontrolle
(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)
- alle Seiten transkribiert?
- Transkription augenscheinlich vollständig und "gut"?
- Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
- Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
- Textregionen
- Titel (heading)
- Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
- Marginalien (marginalia)
- vor den Eintrag auf den sie sich beziehen
- Absätze (paragraph, ggf. paragraph-continued)
- Titel (heading)
- alle Personen und Orte ausgezeichnet?
- Keys vergeben?
- Einheitlich (großzügig) gemacht?
- alle Textphänomene (welche gibt es) ausgezeichnet?
- Überschriften
- durchgestrichen
- unterstrichen
- fett
- hochgestellt
- tiefgestellt
- Abkürzungen
- anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?
transkribus-Export
(welche Einstellungen müssen wir beim Export vornehmen?)
16.08.2022
Produktion: Band 40 Export und Nachkuratierung
Transkribus | TEI-xml | Bemerkungen |
---|---|---|
gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut | <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> | Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben. |
heading-Textregion | <head facs="[...]">[...]</head> | |
marginalia-Textregion | <note place="margin-left" facs="[...]">[...]</note> | Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt. |
paragraph-Textregion | <p facs="[...]">[...]</p> | |
paragraph-continued-Textregion | <ab facs="[...]">[...]</ab> | Absätze können über Seitenumbrüche hinausgehen |
Kuratierung des Exports
(welche Phänomene müssen wir bereinigen oder umformen?)
Datenanreicherung
(wie kriegen wir die )