Experimentieren mit OCR-Software
1. Besuchen Sie die Webseite von ANNO (Historische Österreichische Zeitungen und Zeitschriften) und rufen Sie den Text „Der Besuch des Reichskanzlers Hofmann beim Baron Rotschild“ in der illustrierten humoristischen Volksblatt „Kikeriki“ auf. https://anno.onb.ac.at/cgi-content/anno?aid=kik&datum=18780221&seite=1
Erkunden Sie die Dienstleistungen von ANNO, die beim Umgang mit Digitalisaten für Nutzer*innen zur Verfügung stehen. Lassen Sie ANNO einen Volltext-Version über den Beitrag bzw. Zeitungsseite generieren. Untersuchen Sie die Fehler und stellen Sie Hypothesen über die Ursachen systemischer Fehler auf.
2. Lassen Sie die Zeitungsseite in Originalgröße anzeigen (ORIG) und speichern Sie die Seite als JPG-File. Laden Sie das File in Transkribus Lite hoch. Öffnen Sie das Dokument untersuchen Sie es mit dem Layout-Editor von Transkribus: Werden alle wichtige Layout-Elemente richtig erkannt? Klicken Sie auf den Transkriptions-Button und stöbern Sie in den angebotenen Transkriptions-Modellen. Wählen Sie die richtigen Einstellungen aus lassen Sie den Text das Modell „ONB_Newseye_GT_M1“ transkribieren. Vergleichen Sie den vom Transkribus erstellten Text mit dem von ANNO erstellten ÖNB-Modell. Analysieren Sie die Fehler: Wo liegt ein besseres Ergebnis vor?
3. Exportieren Sie das Dokument als docx-File und erkunden Sie die Leistung von Transkribus über ein anderes Modell (für deutschsprachige Frakturtexte) mit dem gleichen Ausgangstext. Speichern Sie den bearbeiteten Text auch als txt-File (klicken Sie den Pfeil unter dem transkribierten Text an).