Mit ABaC:us stellt die Projektgruppe eine beispielgebende webbasierte Applikation zur Verfügung, die zeitentfernte, in Bibliotheken beherbergte Drucke aus der Barockzeit für wissenschaftliche Fragestellungen zugänglich macht und jederzeit online rezipiert werden kann. Sie wendet sich an eine interessierte (Fach-)Öffentlichkeit, insbesondere an Forscherinnen und Forscher, die in ihren Disziplinen textbezogen arbeiten und von der multimedialen Erschließung dieser Dokumente profitieren möchten.
Die digitale Repräsentation und Aufbereitung der Texte orientiert sich an dem zu erwartenden Kreis von BenutzerInnen. Da die Sprachwissenschaft sich für andere Fragen interessiert als die Literaturwissenschaft oder historisch ausgerichtete Wissenschaften und sich etliche Fragestellungen nicht vorwegnehmen lassen, ist den Herausgeberinnen daran gelegen, die Originaldokumente möglichst authentisch und quellennah abzubilden. Um die Texte zu erschließen, ist in der Annotation*** ***sorgfältig geprüftes Wissen über die Textdokumente kodiert, das über Register und Navigationsinstrumente abgefragt werden kann.
Die Applikation wurde basierend auf dem Publikations-Framework corpus_shell vom Team entwickelt. Sie eignet sich für zwei grundverschiedene Rezeptionshaltungen: das Lesen in den Texten und das Suchen in den Texten. Beide Nutzungssituationen werden durch ein innovatives Web-Interface unterstützt, indem es einerseits den Lesenden den Komfort einer digitalen Lektüreansicht bietet, und andererseits den Suchenden Navigationsinstrumente zur Verfügung stellt, die einen direkten Zugriff auf bestimmte Stellen im Text erlauben. Das adaptive Layout ordnet die Inhalte automatisch je nach verfügbarer Bildschirmgröße in ein, zwei oder drei Spalten an bzw. können BenutzerInnen aus einem der drei Modi wählen. Zur Nutzung der Applikation sind alle modernen Browser geeignet außer Internet Explorer 8.
Die Lektüre in den Werken ist auf zweifache Weise möglich, denn das Leseformat verbindet die Bilddigitalisate der Originaldrucke seitenweise mit dem transkribierten, elektronischen Lesetext. In der synoptischen Ansicht stehen Volltext und Faksimile einander gegenüber, sodass Lesende eine digitale Repräsentation der Druckvorlage in Frakturschrift vor Augen haben und parallel dazu den annotierten Text. Jedes Wort wird mit Lemma- und PoS-Informationen unterlegt, sobald man mit dem Cursor in dessen Nähe kommt, wodurch das Textverständnis – insbesondere bei seltenen Schreibvarianten (wie etwa: vrthelt Lemma: urteilen, POS: VVFIN
) – verbessert wird. Der elektronische Lesetext ist kritisch gesichert und enthält in eckiger Klammer Korrekturvorschläge der Herausgeberinnen. Die Seiten der Leseansicht verfügen über eine Blätterfunktion, sind jedoch auch einzeln über detaillierte Inhaltsverzeichnisse mit Seitenangaben zugänglich.
Ein direkter Einstieg in die Texte ist über die verschiedenen Register möglich: Das alphabetisch sortierte Register der Wortformen ist mit einer Blätterfunktion ausgestattet oder kann nach Anfangsbuchstabenfolgen (von Groß-/Kleinschreibung unabhängig) gefiltert angezeigt und durchsucht werden; analog dazu lässt sich das Register der Lemmata benutzen. Das Register der Wortarten besteht im ersten Abschnitt aus den im Stuttgart-Tübingen-TagSet ausgewiesenen Kategorien und weist im zweiten, erweiterten Teil kombinierte Formen aus, die in Anlehnung an das STTS erstellt wurden, um kontrahierte Wortformen zu etikettieren. Das Register der Personennamen untergliedert sich in historische, biblische und mythologische Namen, wobei historische Namen, die in der Bibel vorkommen, unter den „biblischen Personennamen“ verzeichnet sind. Ein Name wie „Abraham“ kann sowohl unter den historischen als auch unter den biblischen Personennamen aufscheinen. Im Register der Ortsnamen sind Länder und Kontinente, Regionen, Städte und Dörfer, Straßen und Plätze in Wien sowie Berge und Gewässer aufgenommen. Auch Personennamen- und Ortsnamenregister lassen sich nach Anfangsbuchstaben gefiltert anzeigen. Jeder Registereintrag ist mit Frequenzangaben versehen. Beim Klicken auf einen Eintrag wird automatisch in der Suchleiste eine Abfrage generiert, die zu den gewünschten Ergebnissen führt.
Die zweite Möglichkeit der Texterschließung ist die freie Suche über die Suchleiste. Diese erlaubt zweierlei Abfragen: Einerseits die Volltext-Suche nach einzelnen Worten, Phrasen bzw. Kombinationen von Wörtern, andererseits eine Index-Suche, bei der spezifisch nach Wortform, Lemma, Wortart, Personnamen oder Ortsnamen gesucht werden kann. Die Suchleiste bietet eine Autovervollständigungsfunktion: Beginnt man mit der Eingabe, wird eine Liste von möglichen Abfragen vorgeschlagen. Diese Liste ist mit Frequenzangaben versehen und typisiert, d.h. es ist zugleich ersichtlich, ob es sich etwa um einen Personennamen, ein Lemma oder eine Wortart handelt. Wählt man einen Vorschlag aus, wird die entsprechende Abfrage richtig formatiert in das Suchfeld eingetragen und mit dem Klick auf [ihr findet]
bzw. mit der [Enter]
-Taste die Suche gestartet. Die Index-Suche ermöglicht auch eine trunkierte Suche nach einem Wortteil, markiert mit dem Stern-Symbol als Platzhalter (*
). Die Suche nach einem Lemma, etwa mit der Eingabe lemma="Fegefeuer"
, ergibt nicht nur die ihm zugehörigen Wortformen, sondern auch die ihm zugewiesenen Schreibvarianten wie Fegfeuer, Fegfewer, Feg=Feuer, Feegfeuer, Feeg=Feuer, was für die Durchsuchbarkeit historischer Texte von großem Vorteil ist. Die Suche nach einer Wortart, etwa die Suche nach Nomen erfolgt mit der Eingabe pos="NN"
, wobei die im Register gelisteten Kürzel des Stuttgart-Tübingen-TagSets zu verwenden sind. Weiters besteht die Möglichkeit, eine kombinierte Suche von Lemma und Wortart durchzuführen.
CQL | Simple | |
---|---|---|
"Waitzen=Körnlein" | Waitzen=Körnlein | Einfache Volltext-Suche: Worte wie sie im Text vorkommen (Suchbegriff mit doppeltem Bindestrich muss in Anführungszeichen gesetzt werden) |
"arme" "Seelen" | arme Seelen | Phrasen-Suche: Abfolge von hintereinanderfolgenden Wörtern |
"Seele | Fegefeuer" | Mehrwort-Suche mit Operator and : zwei oder mehrere Wörter, die innerhalb eines Paragraphen vorkommen | |
[lemma="Fegefeuer"] | Index-Suche nach Lemma | |
[pos="ADJA"] | Index-Suche nach Wortart | |
[lemma="ja" & pos="PTKANT"] | Kombinierte Index-Suche nach Lemma und Wortart | |
[ lemma=".*chen" ] | Index-Suche nach Wortteil im Lemma | |
[ lemma=".*chen" & pos="N.*" ] | Kombinierte Index-Suche nach Wortteil im Lemma und Wortart | |
[placeName="prag"] | Suche nach Ortsnamen. | |
[persName="mathatias"] | Suche nach Personennamen |
Die Suchergebnisse werden chronologisch nach Werktitel und mit Frequenzangaben gelistet. Durch den Klick auf eines der Werke lassen sich die Ergebnisse bei Bedarf weiter filtern. Unter der Übersicht werden die Einzelergebnisse in chronologischer Reihenfolge ihres Vorkommens innerhalb der Texte in der sogenannten keyword in context-Ansicht dargestellt. Das gesuchte Schlüsselwort ist dabei fett hervorgehoben und wird zentriert in seiner jeweiligen Textumgebung angezeigt, sodass sich ein erster Sinnzusammenhang erschließt. Die Darstellung zeigt die jeweils zehn ersten Ergebnisse der Suche – um weitere Ergebnisse einzusehen, kann die Blätterfunktion verwendet werden. Die Fundstelle jedes Belegs wird mit Werkkurztitel und Seitenzahl unmittelbar darüber angegeben; klickt man auf diese rot markierte Zeile, öffnet sich auch die angegebene Textseite in der synoptischen Volltext- und Faksimileansicht, wo das gesuchte Wort grau unterlegt in seinem größeren Seitenkontext erscheint.