Exportworkflow: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Zeile 35: | Zeile 35: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
− | ! Transkribus !! TEI-xml | + | ! Transkribus !! TEI-xml !! Bemerkungen |
|- | |- | ||
− | | gap-tag zu Beginn eines Eintrags mit resp-Attribut || <nowiki><div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div></nowiki> | + | | gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut || <nowiki><div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div></nowiki> || Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben. |
|- | |- | ||
− | | heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> | + | | heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> || |
|- | |- | ||
− | | marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> | + | | marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> || |
|- | |- | ||
− | | paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> | + | | paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> || |
|- | |- | ||
− | | paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> | + | | paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> || |
|} | |} | ||
Version vom 16. August 2022, 09:45 Uhr
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
Inhaltsverzeichnis
Kontrolle
(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)
- alle Seiten transkribiert?
- Transkription augenscheinlich vollständig und "gut"?
- Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
- Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
- Textregionen
- Titel (heading)
- Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
- Marginalien (marginalia)
- vor den Eintrag auf den sie sich beziehen
- Absätze (paragraph, ggf. paragraph-continued)
- Titel (heading)
- alle Personen und Orte ausgezeichnet?
- Keys vergeben?
- Einheitlich (großzügig) gemacht?
- alle Textphänomene (welche gibt es) ausgezeichnet?
- Überschriften
- durchgestrichen
- unterstrichen
- fett
- hochgestellt
- tiefgestellt
- Abkürzungen
- anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?
transkribus-Export
(welche Einstellungen müssen wir beim Export vornehmen?)
16.08.2022
Produktion: Band 40 Export und Nachkuratierung
Transkribus | TEI-xml | Bemerkungen |
---|---|---|
gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut | <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> | Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben. |
heading-Textregion | <head facs="[...]">[...]</head> | |
marginalia-Textregion | <note place="margin-left" facs="[...]">[...]</note> | |
paragraph-Textregion | <p facs="[...]">[...]</p> | |
paragraph-continued-Textregion | <ab facs="[...]">[...]</ab> |
Kuratierung des Exports
(welche Phänomene müssen wir bereinigen oder umformen?)
Datenanreicherung
(wie kriegen wir die )