Transkribus-Probleme

Aus Consilium Communis Neuss
Zur Navigation springen Zur Suche springen

Hier können wir Probleme rund um das Programm Transkribus dokumentieren.

Tag-Suche in Webversion nicht verfügbar (März 2026)

Eine Tag-Suche ist in der Webversion zur Zeit leider nicht verfügbar. Die Tag-Suche ist für uns von Bedeutung, da wir Annotation/Tagging in Transkribus vornehmen und Korrekturen dort ebenfalls stattfinden. Vor allem die Korrektur von Dubletten in der ID-Vergabe erfordert die Möglichkeit der Suche nach Tags mit bestimmten Attributwerten, um z. B. eine Übersicht aller Personenmarkierungen, deren Attribut key eine bestimmte ID enthält, zu erstellen.

Inkompatibilitäten zwischen Web- und Desktopversion bei der Verwendung von Zwischenraumzeichen (März 2026)

Textformatierung mit Zwischenraumzeichen in Transkribus

Wenn mehrere Leerzeichen oder Tabulatorzeichen in der Desktopversion hintereinander geschrieben wurden, werden diese bei Aufruf der Seite in der Webversion nicht geladen bzw. zu einem einzelnen Leerzeichen reduziert. In der Webversion können keine Tabulatorzeichen geschrieben werden. Die sicherste Vorgehensweise für die Zukunft wäre, keine Zwischenraumzeichen wie Leerzeichen oder Tabulatorzeichen für die Nachbildung der Textformatierung zu verwenden. Bisher bearbeitete Seiten müssen nicht zeitnah überarbeitet werden. Bei einer weiteren Bearbeitung betroffener Seiten in der Webversion von Transrkribus müssten ggf. die Tags korrigiert werden (mehr dazu weiter unte).

Wenn speziellere Gestaltungen von Seiten (Rechnungsposition wie im Beispielbild sind ein häufiger Fall), durch die Transkription und Annotation wiedergespiegelt werden soll, müssen wir noch eine einheitliche Vorgehensweise finden. Möglich wäre in bestimmtem Fällen eine Ersetzung der Textregionen durch Tabellen, oder die Verwendung von speziellen Tags für Textregionen oder im Text.

Es gehen aber nicht nur überzählige Leerzeichen verloren. Auch Tags, die in der Desktopversion an betroffenen Textstellen platziert wurden, kommen durcheinander, wenn sich die Anzahl der Zeichen auf nicht vorgesehene Art und Weise ändert, da der Anfang der Markierung auf der Nummer des Zeichens basiert, ab dem die Markierung beginnt (offset) und die Länge der Markierung ist die Anzahl der Zeichen, die sie umfassen soll (length). Dazu ein kleines Beispiel aus den Transkribus-Daten von Band 2, S. 35, Zeile 4 wie die Informationen zu Tags abgespeichert werden: occupation {offset:4; length:11;key:24;} place {offset:26; length:12;key:70;} expan {offset:66; length:1;}.

Zeilenübergreifendes Tagging im Safari-Browser (März 2026)

Eine Person berichtete von dem Problem, dass beim Versuch ein zeilenübergreifendes Wort vollständig auszuwählen (zwecks Tagging), die Auswahl auf der zweiten Zeile verloren ging und die Textstelle somit nicht vollständig getaggt werden konnte. Dieses Problem trat mit dem Safari-Browser von Apple auf. Mit Firefox funktionierte es dann aber.