Exportworkflow: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Zeile 32: | Zeile 32: | ||
== 16.08.2022 == | == 16.08.2022 == | ||
[https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/issues/21 Produktion: Band 40 Export und Nachkuratierung] | [https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/issues/21 Produktion: Band 40 Export und Nachkuratierung] | ||
− | + | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! Transkribus !! TEI-xml | ! Transkribus !! TEI-xml | ||
|- | |- | ||
− | | gap-tag zu Beginn eines Eintrags mit resp-Attribut || <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> | + | | gap-tag zu Beginn eines Eintrags mit resp-Attribut || <nowiki><div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div></nowiki> |
|- | |- | ||
− | | heading-Textregion || <head facs="[...]">[...]</head> | + | | heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> |
|- | |- | ||
− | | marginalia-Textregion || <note place="margin-left" facs="[...]">[...]</note> | + | | marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> |
|- | |- | ||
− | | paragraph-Textregion || <p facs="[...]">[...]</p> | + | | paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> |
|- | |- | ||
− | | paragraph-continued-Textregion || <ab facs="[...]">[...]</ab> | + | | paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> |
|} | |} | ||
Version vom 16. August 2022, 09:31 Uhr
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
Inhaltsverzeichnis
Kontrolle
(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)
- alle Seiten transkribiert?
- Transkription augenscheinlich vollständig und "gut"?
- Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
- Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
- Textregionen
- Titel (heading)
- Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
- Marginalien (marginalia)
- vor den Eintrag auf den sie sich beziehen
- Absätze (paragraph, ggf. paragraph-continued)
- Titel (heading)
- alle Personen und Orte ausgezeichnet?
- Keys vergeben?
- Einheitlich (großzügig) gemacht?
- alle Textphänomene (welche gibt es) ausgezeichnet?
- Überschriften
- durchgestrichen
- unterstrichen
- fett
- hochgestellt
- tiefgestellt
- Abkürzungen
- anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?
transkribus-Export
(welche Einstellungen müssen wir beim Export vornehmen?)
16.08.2022
Produktion: Band 40 Export und Nachkuratierung
Transkribus | TEI-xml |
---|---|
gap-tag zu Beginn eines Eintrags mit resp-Attribut | <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> |
heading-Textregion | <head facs="[...]">[...]</head> |
marginalia-Textregion | <note place="margin-left" facs="[...]">[...]</note> |
paragraph-Textregion | <p facs="[...]">[...]</p> |
paragraph-continued-Textregion | <ab facs="[...]">[...]</ab> |
Kuratierung des Exports
(welche Phänomene müssen wir bereinigen oder umformen?)
Datenanreicherung
(wie kriegen wir die )