Exportworkflow: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Zeile 47: | Zeile 47: | ||
| paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> || Absätze können über Seitenumbrüche hinausgehen | | paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> || Absätze können über Seitenumbrüche hinausgehen | ||
|} | |} | ||
+ | |||
+ | * Transformationsskript schreibt Lehrzeichen bei der Datenkuratierung ins TEI für Fälle, in denen Zeilenumbrüche nicht angezeigt werden. Besser als wenn die BearbeiterInnen das händisch machen müssen. | ||
= Kuratierung des Exports = | = Kuratierung des Exports = |
Version vom 16. August 2022, 15:04 Uhr
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
Inhaltsverzeichnis
Kontrolle
(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)
- alle Seiten transkribiert?
- Transkription augenscheinlich vollständig und "gut"?
- Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
- Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
- Textregionen
- Titel (heading)
- Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
- Marginalien (marginalia)
- vor den Eintrag auf den sie sich beziehen
- Absätze (paragraph, ggf. paragraph-continued)
- Titel (heading)
- alle Personen und Orte ausgezeichnet?
- Keys vergeben?
- Einheitlich (großzügig) gemacht?
- alle Textphänomene (welche gibt es) ausgezeichnet?
- Überschriften
- durchgestrichen
- unterstrichen
- fett
- hochgestellt
- tiefgestellt
- Abkürzungen
- anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?
transkribus-Export
(welche Einstellungen müssen wir beim Export vornehmen?)
16.08.2022
Produktion: Band 40 Export und Nachkuratierung
Transkribus | TEI-xml | Bemerkungen |
---|---|---|
gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut | <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> | Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben. |
heading-Textregion | <head facs="[...]">[...]</head> | |
marginalia-Textregion | <note place="margin-left" facs="[...]">[...]</note> | Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt. |
paragraph-Textregion | <p facs="[...]">[...]</p> | |
paragraph-continued-Textregion | <ab facs="[...]">[...]</ab> | Absätze können über Seitenumbrüche hinausgehen |
- Transformationsskript schreibt Lehrzeichen bei der Datenkuratierung ins TEI für Fälle, in denen Zeilenumbrüche nicht angezeigt werden. Besser als wenn die BearbeiterInnen das händisch machen müssen.
Kuratierung des Exports
(welche Phänomene müssen wir bereinigen oder umformen?)
Datenanreicherung
(wie kriegen wir die )