Ziel des Deutschen Textarchivs (DTA) ist die Erstellung eines disziplinenübergreifenden Volltextkorpus deutschsprachiger Texte. Grundlage hierfür bilden digitale Faksimiles historischer Druckwerke (Entstehungszeit der Drucke zwischen ca. 1600 und 1900). Das Korpus umfasst Werke verschiedener Textsorten, literarischer Gattungen und wissenschaftlicher Disziplinen. Ziel des Projekts ist die Bereitstellung und – aufgrund der großen Textmenge weitestgehend automatische – linguistische Aufbereitung eines vielseitigen, umfangreichen Textbestandes auf dieser heterogenen Grundlage.
Die Erfassung der Texte im DTA erfolgt nach dem Prinzip der Wahrung des historischen Sprachstandes der Texte. Aufgrund dieser Zielsetzung wird darauf geachtet, bei der Texterfassung die Zahl der (unvermeidbaren) Interpretationen typographischer Gegebenheiten gering zu halten. Um unbewusste Modernisierungen oder Korrekturen zu vermeiden, werden die Texte von Nicht-Muttersprachlern eingegeben. Eine Druckfehlerkorrektur erfolgt daher während der Erfassung nicht, kann aber im Erschließungs- und Korrekturprozess eingeschränkt vorgenommen werden.
DTA-Richtlinien zur Texterfassung anschauen …
Das DTA-Basisformat soll im Rahmen der DTA-Richtlinien eine uneingeschränkte Textaufbereitung ermöglichen und dabei gleichzeitig Variationsspielräume bei der Annotation so einschränken, dass die Kohärenz der DTA-Texte untereinander gewährleistet wird. Für dieses Ziel stellt die Ausrichtung des DTA-Korpus in der Diachronie einerseits und die Textsortenvielfalt andererseits eine große Herausforderung dar, resultiert sie doch u. a. in einer strukturellen Variabilität der Vorlagen, der mit dem vorliegenden Annotationstagset Genüge getan werden muss.
Mit der Korrekturumgebung des Deutschen Textarchivs können Sie Stellen zur Korrektur kennzeichnen bzw. vorschlagen. Die Korrekturen werden von Mitarbeitern des DTA geprüft und anschließend vorgenommen. Die Durchsicht von Texten kann sehr anstrengend und monoton sein. Sie müssen den Text nicht vollständig durchsehen, sondern können verschiedene Arten der Korrektur wählen.
Wenn Zeichen nicht korrekt dargestellt werden (beispielsweise als Kästchen), dann hilft es, einen Unicode-Font zu installieren:
Wenn Sie keinen Unicode-Font installieren können/wollen oder die Darstellung auch nach dessen Installation noch verzerrt sein sollte, können Sie entsprechende Einstellungen in Ihrem Profil vornehmen.
Die Korrekturumgebung sollte mit allen modernen Browsern funktionieren. Beachten Sie bitte, dass der Internet Explorer von Microsoft deshalb nur eingeschränkt nutzbar ist.
Folgende verschiedene Ansichten können ausgewählt werden:
Folgende Tastaturkürzel stehen Ihnen innerhalb der Korrekturumgebung zur Verfügung:
Firefox | Chrome, Safari | Opera | Internet Explorer | Funktion |
---|---|---|---|---|
N | ' | repeat(4) %]nächste Seite im Buch | |||
P | ' | repeat(4) %]vorhergehende Seite im Buch | |||
R | ' | repeat(4) %]Zufallsseite | |||
B | ' | repeat(4) %]zufälliges Buch | |||
I | ' | repeat(4) %]neues Ticket | |||
H | ' | repeat(4) %]Ansicht: HTML | |||
X | ' | repeat(4) %]Ansicht: XML | |||
T | ' | repeat(4) %]Ansicht: Text | |||
C | ' | repeat(4) %]Ansicht: CAB |