Transkribus-Probleme

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen

Hier können wir Probleme rund um das Programm Transkribus dokumentieren.

Tag-Suche in Webversion nicht verfügbar (März 2026)

Eine Tag-Suche ist in der Webversion zur Zeit leider nicht verfügbar. Die Tag-Suche ist für uns von Bedeutung, da wir Annotation/Tagging in Transkribus vornehmen und Korrekturen dort ebenfalls stattfinden. Vor allem die Korrektur von Dubletten in der ID-Vergabe erfordert die Möglichkeit der Suche nach Tags mit bestimmten Attributwerten, um z. B. eine Übersicht aller Personenmarkierungen, deren Attribut key eine bestimmte ID enthält, zu erstellen.

Inkompatibilitäten zwischen Web- Desktopversion bei der Verwendung von Zwischenraumzeichen (März 2026)

Textformatierung mit Zwischenraumzeichen in Transkribus

Wenn mehrere Leerzeichen oder Tabulatorzeichen in der Desktopversion hintereinander geschrieben wurden, werden diese bei Aufruf der Seite in der Webversion nicht geladen bzw. zu einem einzelnen Leerzeichen reduziert. In der Webversion können keine Tabulatorzeichen geschrieben werden. Die sicherste Vorgehensweise für die Zukunft wäre, keine Zwischenraumzeichen wie Leerzeichen oder Tabulatorzeichen für die Nachbildung der Textformatierung zu verwenden.

Es gehen aber nicht nur die überzähligen Leerzeichen verloren. Auch Tags, die in der Desktopversion an betroffenen Textstellen platziert wurden, kommen durcheinander, wenn sich die Anzahl der Zeichen auf nicht vorgesehene Art und Weise ändert, da der Anfang der Markierung auf der Nummer des Zeichens basiert, ab dem die Markierung beginnt (offset) und die Länge der Markierung ist die Anzahl der Zeichen, die sie umfassen soll (length). Dazu ein kleines Beispiel aus den Transkribus-Daten von Band 2, S. 35, Zeile 4 wie die Informationen zu Tags abgespeichert werden: occupation {offset:4; length:11;key:24;} place {offset:26; length:12;key:70;} expan {offset:66; length:1;}. Wenn sich nun die Anzahl der Zeichen ändert.