Exportworkflow: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Admin (Diskussion | Beiträge) |
Admin (Diskussion | Beiträge) |
||
Zeile 30: | Zeile 30: | ||
= transkribus-Export = | = transkribus-Export = | ||
− | |||
Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus: | Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus: | ||
− | [[Datei:CC-Transkribus-Export.png| | + | |
+ | [[Datei:CC-Transkribus-Export.png|mini|zentriert|600px|Transkribus Export]] | ||
+ | |||
+ | Für weitere Workflows s. die Bände in [https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/tree/main/data-export2tei/volumes/ CC-GitLab-Repository] und die entsprechenden Readme.md Dateien | ||
= Kuratierung des Exports = | = Kuratierung des Exports = |
Version vom 13. Januar 2023, 15:34 Uhr
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
Inhaltsverzeichnis
Kontrolle
(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)
- alle Seiten transkribiert?
- Transkription augenscheinlich vollständig und "gut"?
- Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
- Überflüssiges gelöscht?
- erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
- Nachträglich eingefügte Seitenzahlen
- Entsprechen die Textregionen der Textstruktur, wurden entsprechende Strukturtypen vergeben?
- Titel und Überschriften(heading)
- Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht (Bsp. in Band 40)
- Marginalien (marginalia)
- vor den Eintrag auf den sie sich beziehen, wenn sie als Überschrift/Kurzzusammenfassung fungieren
- Absätze (paragraph, ggf. paragraph-continued)
- Titel und Überschriften(heading)
- alle Personen und Orte ausgezeichnet?
- Keys vergeben?
- Einheitlich (großzügig) gemacht? ("Bürgermeister Momm" statt nur "Momm", "Director Meis" statt nur "Meis")
- alle Textphänomene (welche gibt es) ausgezeichnet?
- durchgestrichen
- unterstrichen
- fett
- hochgestellt
- tiefgestellt
- Abkürzungen
- anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?
transkribus-Export
Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus:
Für weitere Workflows s. die Bände in CC-GitLab-Repository und die entsprechenden Readme.md Dateien
Kuratierung des Exports
(welche Phänomene müssen wir bereinigen oder umformen?)
Datenanreicherung
(wie kriegen wir die )