Exportworkflow: Unterschied zwischen den Versionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen
Zeile 7: Zeile 7:
 
** Transkription augenscheinlich vollständig und "gut"?
 
** Transkription augenscheinlich vollständig und "gut"?
 
** Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
 
** Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
** Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
+
** Überflüssiges gelöscht?
* Textregionen
+
*** erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
** Titel (heading)
+
*** Nachträglich eingefügte Seitenzahlen
*** Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
+
* Entsprechen die Textregionen Textstruktur, wurden entsprechende Strukturtypen vergeben?
 +
** Titel und Überschriften(heading)
 +
*** Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht (Bsp. in Band 40)
 
** Marginalien (marginalia)
 
** Marginalien (marginalia)
*** vor den Eintrag auf den sie sich beziehen
+
*** vor den Eintrag auf den sie sich beziehen, wenn sie als Überschrift/Kurzzusammenfassung fungieren
 
** Absätze (paragraph, ggf. paragraph-continued)
 
** Absätze (paragraph, ggf. paragraph-continued)
 
* alle Personen und Orte ausgezeichnet?  
 
* alle Personen und Orte ausgezeichnet?  
 
** Keys vergeben?  
 
** Keys vergeben?  
** Einheitlich (großzügig) gemacht?
+
** Einheitlich (großzügig) gemacht? ("Bürgermeister Momm" statt nur "Momm", "Director Meis" statt nur "Meis")
 
* alle Textphänomene (welche gibt es) ausgezeichnet?
 
* alle Textphänomene (welche gibt es) ausgezeichnet?
** Überschriften
 
 
** durchgestrichen
 
** durchgestrichen
 
** unterstrichen
 
** unterstrichen

Version vom 13. September 2022, 09:19 Uhr

Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?

Kontrolle

(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)

  • alle Seiten transkribiert?
    • Transkription augenscheinlich vollständig und "gut"?
    • Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
    • Überflüssiges gelöscht?
      • erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
      • Nachträglich eingefügte Seitenzahlen
  • Entsprechen die Textregionen Textstruktur, wurden entsprechende Strukturtypen vergeben?
    • Titel und Überschriften(heading)
      • Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht (Bsp. in Band 40)
    • Marginalien (marginalia)
      • vor den Eintrag auf den sie sich beziehen, wenn sie als Überschrift/Kurzzusammenfassung fungieren
    • Absätze (paragraph, ggf. paragraph-continued)
  • alle Personen und Orte ausgezeichnet?
    • Keys vergeben?
    • Einheitlich (großzügig) gemacht? ("Bürgermeister Momm" statt nur "Momm", "Director Meis" statt nur "Meis")
  • alle Textphänomene (welche gibt es) ausgezeichnet?
    • durchgestrichen
    • unterstrichen
    • fett
    • hochgestellt
    • tiefgestellt
    • Abkürzungen
  • anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?

transkribus-Export

(welche Einstellungen müssen wir beim Export vornehmen?)

16.08.2022

Produktion: Band 40 Export und Nachkuratierung

Transkribus TEI-xml Bemerkungen
gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben.
heading-Textregion <head facs="[...]">[...]</head>
marginalia-Textregion <note place="margin-left" facs="[...]">[...]</note> Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt.
paragraph-Textregion <p facs="[...]">[...]</p>
paragraph-continued-Textregion <ab facs="[...]">[...]</ab> Absätze können über Seitenumbrüche hinausgehen
  • Transformationsskript schreibt Lehrzeichen bei der Datenkuratierung ins TEI für Fälle, in denen Zeilenumbrüche nicht angezeigt werden. Besser als wenn die BearbeiterInnen das händisch machen müssen.

Kuratierung des Exports

(welche Phänomene müssen wir bereinigen oder umformen?)

Datenanreicherung

(wie kriegen wir die )