Exportworkflow: Unterschied zwischen den Versionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen
Zeile 32: Zeile 32:
 
== 16.08.2022 ==
 
== 16.08.2022 ==
 
[https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/issues/21 Produktion: Band 40 Export und Nachkuratierung]
 
[https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/issues/21 Produktion: Band 40 Export und Nachkuratierung]
Basierend auf der Bearbeitung von Band 40
+
 
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
 
! Transkribus !! TEI-xml
 
! Transkribus !! TEI-xml
 
|-
 
|-
| gap-tag zu Beginn eines Eintrags mit resp-Attribut || <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div>
+
| gap-tag zu Beginn eines Eintrags mit resp-Attribut || <nowiki><div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div></nowiki>
 
|-
 
|-
| heading-Textregion || <head facs="[...]">[...]</head>
+
| heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki>
 
|-
 
|-
| marginalia-Textregion || <note place="margin-left" facs="[...]">[...]</note>
+
| marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki>
 
|-
 
|-
| paragraph-Textregion || <p facs="[...]">[...]</p>
+
| paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki>
 
|-
 
|-
| paragraph-continued-Textregion || <ab facs="[...]">[...]</ab>
+
| paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki>
 
|}
 
|}
  

Version vom 16. August 2022, 09:31 Uhr

Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?

Kontrolle

(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)

  • alle Seiten transkribiert?
    • Transkription augenscheinlich vollständig und "gut"?
    • Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
    • Überflüssiges gelöscht? -> erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
  • Textregionen
    • Titel (heading)
      • Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht
    • Marginalien (marginalia)
      • vor den Eintrag auf den sie sich beziehen
    • Absätze (paragraph, ggf. paragraph-continued)
  • alle Personen und Orte ausgezeichnet?
    • Keys vergeben?
    • Einheitlich (großzügig) gemacht?
  • alle Textphänomene (welche gibt es) ausgezeichnet?
    • Überschriften
    • durchgestrichen
    • unterstrichen
    • fett
    • hochgestellt
    • tiefgestellt
    • Abkürzungen
  • anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?

transkribus-Export

(welche Einstellungen müssen wir beim Export vornehmen?)

16.08.2022

Produktion: Band 40 Export und Nachkuratierung

Transkribus TEI-xml
gap-tag zu Beginn eines Eintrags mit resp-Attribut <div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div>
heading-Textregion <head facs="[...]">[...]</head>
marginalia-Textregion <note place="margin-left" facs="[...]">[...]</note>
paragraph-Textregion <p facs="[...]">[...]</p>
paragraph-continued-Textregion <ab facs="[...]">[...]</ab>

Kuratierung des Exports

(welche Phänomene müssen wir bereinigen oder umformen?)

Datenanreicherung

(wie kriegen wir die )