Exportworkflow: Unterschied zwischen den Versionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen
Zeile 41: Zeile 41:
 
| heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> ||  
 
| heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> ||  
 
|-
 
|-
| marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> ||  
+
| marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> || Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt.
 
|-
 
|-
 
| paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> ||  
 
| paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> ||  
 
|-
 
|-
| paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> ||  
+
| paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> || Absätze können über Seitenumbrüche hinausgehen
 
|}
 
|}
  

Version vom 16. August 2022, 10:18 Uhr

Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?

Kontrolle

(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)

  • alle Seiten transkribiert?
    • Transkription augenscheinlich vollständig und "gut"?
    • Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
    • Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
  • Textregionen
    • Titel (heading)
      • Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
    • Marginalien (marginalia)
      • vor den Eintrag auf den sie sich beziehen
    • Absätze (paragraph, ggf. paragraph-continued)
  • alle Personen und Orte ausgezeichnet?
    • Keys vergeben?
    • Einheitlich (großzügig) gemacht?
  • alle Textphänomene (welche gibt es) ausgezeichnet?
    • Überschriften
    • durchgestrichen
    • unterstrichen
    • fett
    • hochgestellt
    • tiefgestellt
    • Abkürzungen
  • anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?

transkribus-Export

(welche Einstellungen müssen wir beim Export vornehmen?)

16.08.2022

Produktion: Band 40 Export und Nachkuratierung

Transkribus TEI-xml Bemerkungen
gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div> Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben.
heading-Textregion <head facs="[...]">[...]</head>
marginalia-Textregion <note place="margin-left" facs="[...]">[...]</note> Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt.
paragraph-Textregion <p facs="[...]">[...]</p>
paragraph-continued-Textregion <ab facs="[...]">[...]</ab> Absätze können über Seitenumbrüche hinausgehen

Kuratierung des Exports

(welche Phänomene müssen wir bereinigen oder umformen?)

Datenanreicherung

(wie kriegen wir die )