Exportworkflow: Unterschied zwischen den Versionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen
Zeile 30: Zeile 30:
  
 
= transkribus-Export =
 
= transkribus-Export =
(welche Einstellungen müssen wir beim Export vornehmen?)
 
  
 
Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus:
 
Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus:
[[Datei:CC-Transkribus-Export.png|links|mini]]
+
 
 +
[[Datei:CC-Transkribus-Export.png|mini|zentriert|600px|Transkribus Export]]
 +
 
 +
Für weitere Workflows s. die Bände in [https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/tree/main/data-export2tei/volumes/ CC-GitLab-Repository] und die entsprechenden Readme.md Dateien
  
 
= Kuratierung des Exports =
 
= Kuratierung des Exports =

Version vom 13. Januar 2023, 15:34 Uhr

Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?

Kontrolle

(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)

  • alle Seiten transkribiert?
    • Transkription augenscheinlich vollständig und "gut"?
    • Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
    • Überflüssiges gelöscht?
      • erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
      • Nachträglich eingefügte Seitenzahlen
  • Entsprechen die Textregionen der Textstruktur, wurden entsprechende Strukturtypen vergeben?
    • Titel und Überschriften(heading)
      • Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht (Bsp. in Band 40)
    • Marginalien (marginalia)
      • vor den Eintrag auf den sie sich beziehen, wenn sie als Überschrift/Kurzzusammenfassung fungieren
    • Absätze (paragraph, ggf. paragraph-continued)
  • alle Personen und Orte ausgezeichnet?
    • Keys vergeben?
    • Einheitlich (großzügig) gemacht? ("Bürgermeister Momm" statt nur "Momm", "Director Meis" statt nur "Meis")
  • alle Textphänomene (welche gibt es) ausgezeichnet?
    • durchgestrichen
    • unterstrichen
    • fett
    • hochgestellt
    • tiefgestellt
    • Abkürzungen
  • anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?

transkribus-Export

Über "Client export" exportiert man es im "Transkribus Document" Format und bei "Export page" wählt man nur "Export Page" aus:

Transkribus Export

Für weitere Workflows s. die Bände in CC-GitLab-Repository und die entsprechenden Readme.md Dateien

Kuratierung des Exports

(welche Phänomene müssen wir bereinigen oder umformen?)

Datenanreicherung

(wie kriegen wir die )