Der Fürther Altstadtverein, anno 1975 als immens politische Bürgervereinigung zur Rettung der Altstadt vor Verwahrlosung und drohendem Abriss gegründet, gibt seit inzwischen fast 50 Jahren das »Altstadtbläddla« als Vereinszeitschrift heraus. Mittlerweile sind 57 Ausgaben erschienen, die spannende Einblicke in die jüngere wie die ältere (archäologisch erforschte) Stadtgeschichte ermöglichen.
Während der Altstadtverein selbst erklärtermaßen bemüht ist, nach Möglichkeit alle je erschienenen Ausgaben des Altstadtbläddlas auf seiner eigenen Website in digitalisierter Form zum Download anzubieten, gehen wir im FürthWiki noch einen entscheidenden Schritt weiter: Wir laden nicht nur die gescannten oder bereits in digitaler Form erzeugten Exemplare der Vereins-Postille auf unseren Server hoch, wir indizieren darüber hinaus noch jede einzelne Seite, um deren Inhalte per einfacher Textsuche auffindbar zu machen!
Als Beispiel sei auf die Seite 20 von Heft 46 aus dem Jahr 2012 verwiesen: Man sieht rechts das Abbild der originalen Seite und links den maschinell per automatischer Zeichenerkennung generierten Textauszug, der wiederum über das Standard-Suchfeld des FürthWikis durchkämmt werden kann. Wenn man also zum Exempel nach dem Wort »Nonne« sucht, bekommt man eben jene Altstadtbläddla-Seiten als Treffer angezeigt, auf denen die so bezeichnete Dachziegel-Form Erwähnung findet.
Die Qualität der Texterkennung ist ziemlich durchwachsen: Je komplexer das Seitenlayout (Fotos, Anzeigen, unübliche Zierschriften etc.), desto schlechter ist das Ergebnis, und eine grundsätzlich immer mögliche manuelle Korrektur ist schon der schieren Menge wegen viel zu aufwendig und von unseren Ehrenamtlichen nicht zu leisten. Immerhin werden die redaktionellen Texte im Spaltensatz – und auf die kommt es ja im Wesentlichen an – gut erkannt und damit im Suchindex erfassbar.
Wenn man also weiß oder ahnt, dass in grauer Vorzeit des Altstadtvereins irgendwer mal irgendwas über irgendjemanden geschrieben hat, dann hat man jetzt eine reelle Chance, den entsprechenden Beitrag über eine Stichwortsuche im FürthWiki ruck-zuck ausfindig machen zu können...
Die »jüngeren« Hefte (Nr. 42 – 57 von 2008 bis 2024) sind bereits vollständig bearbeitet und damit durchsuchbar. Bei den älteren Ausgaben des Altstadtbläddlas dauert es noch ein wenig, denn die liegen uns – wenn überhaupt – nur im analogen Original aus Papier vor, müssen also erst eingescannt und in mehreren Prozess-Schritten bearbeitet werden.
Tolle Sache! Große Bewunderung. Erst gestern Abend las ich die Nr. 57 und habe mich gefragt, wie man an frühere Texte zum gleichen Stichwort gelangen könnte.
#1
Danke für die Blumen! Wir wollen das noch viel weiter vorantreiben und langfristig ausnahmslos alles einscannen und durchsuchbar machen, was wir an Fürth-bezogener Literatur im Schrank stehen haben (und das ist eine ganze Menge). Nicht alles davon werden wir aus urheberrechtlichen Gründen auch veröffentlichen, aber immerhin zur internen Recherche für unsere Aktiven verfügbar machen können.
Der Knackpunkt ist dabei inzwischen nicht mehr die Technik – wir haben alles Nötige und auch den passenden Workflow – sondern die »Machtfrage«: Wer macht’s? Der Flaschenhals ist die manuelle Erfassungsarbeit (Seite für Seite scannen, hochladen und indizieren), dafür braucht es trotz aller maschinellen Unterstützung halt genug Aktive, die sich einer solch
drögenmeditativen Tätigkeit hingeben wollen...#2