Exportworkflow: Unterschied zwischen den Versionen

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen
Zeile 1: Zeile 1:
 
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
 
Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?
 +
* [[Diskussionen zu Datenmodell, Kuratierung und Export]]
  
 
= Kontrolle =
 
= Kontrolle =
Zeile 30: Zeile 31:
 
= transkribus-Export =
 
= transkribus-Export =
 
(welche Einstellungen müssen wir beim Export vornehmen?)
 
(welche Einstellungen müssen wir beim Export vornehmen?)
 
== 16.08.2022 ==
 
[https://git.uni-wuppertal.de/dhsfu/consilium-communis/-/issues/21 Produktion: Band 40 Export und Nachkuratierung]
 
 
{| class="wikitable"
 
|-
 
! Transkribus !! TEI-xml !! Bemerkungen
 
|-
 
| gap-tag zu Beginn bzw. in der ersten Textregion eines Eintrags mit resp-Attribut || <nowiki><div xml:id="B_01_01-[Band Nr.]-[Eintragsnummer]" type="entry" resp="[BearbeiterInnen]" n="[Eintragsnummer]">[...]</div></nowiki> || Es kann mehrere Einträge auf einer Seite geben und es kann Einträge über mehrere Seiten hinweg geben.
 
|-
 
| heading-Textregion || <nowiki><head facs="[...]">[...]</head></nowiki> ||
 
|-
 
| marginalia-Textregion || <nowiki><note place="margin-left" facs="[...]">[...]</note></nowiki> || Das place-Attribut wird basierend auf den Koordinaten automatisch im XSLT-Skript erzeugt.
 
|-
 
| paragraph-Textregion || <nowiki><p facs="[...]">[...]</p></nowiki> ||
 
|-
 
| paragraph-continued-Textregion || <nowiki><ab facs="[...]">[...]</ab></nowiki> || Absätze können über Seitenumbrüche hinausgehen
 
|}
 
 
* Transformationsskript schreibt Lehrzeichen bei der Datenkuratierung ins TEI für Fälle, in denen Zeilenumbrüche nicht angezeigt werden. Besser als wenn die BearbeiterInnen das händisch machen müssen.
 
  
 
= Kuratierung des Exports =
 
= Kuratierung des Exports =

Version vom 13. September 2022, 09:49 Uhr

Worum geht es: Wir kommen wir von einem transkribus-Export zu den finalen TEI-Daten?

Kontrolle

(wie stellen wir sicher, dass ein Band Exportreif ist? Was ist zu prüfen?)

  • alle Seiten transkribiert?
    • Transkription augenscheinlich vollständig und "gut"?
    • Fragezeichen im Text, die noch zu klären sind? Können die noch gelöst werden?
    • Überflüssiges gelöscht?
      • erstes Wort der nächsten Seite steht oft am unteren Seitenrand -> löschen, falls transkribiert!
      • Nachträglich eingefügte Seitenzahlen
  • Entsprechen die Textregionen Textstruktur, wurden entsprechende Strukturtypen vergeben?
    • Titel und Überschriften(heading)
      • Sitzungsnummer Teil des Titels, da sie sich auf die ganze Sitzung bezieht (Bsp. in Band 40)
    • Marginalien (marginalia)
      • vor den Eintrag auf den sie sich beziehen, wenn sie als Überschrift/Kurzzusammenfassung fungieren
    • Absätze (paragraph, ggf. paragraph-continued)
  • alle Personen und Orte ausgezeichnet?
    • Keys vergeben?
    • Einheitlich (großzügig) gemacht? ("Bürgermeister Momm" statt nur "Momm", "Director Meis" statt nur "Meis")
  • alle Textphänomene (welche gibt es) ausgezeichnet?
    • durchgestrichen
    • unterstrichen
    • fett
    • hochgestellt
    • tiefgestellt
    • Abkürzungen
  • anfang jedes Eintrags mit gap gekennzeichnet? Zuständige Person/en aus der Tabelle übernommen?

transkribus-Export

(welche Einstellungen müssen wir beim Export vornehmen?)

Kuratierung des Exports

(welche Phänomene müssen wir bereinigen oder umformen?)

Datenanreicherung

(wie kriegen wir die )