ReN
English Version

Datenzugang

Einfache Suche   Korpus in ANNIS öffnen   Korpus beim HZSK

Nutzung des Korpus in ANNIS

Die aktuelle Version des Korpus lässt sich über die ANNIS-Installation des HZSK nutzen (http://annis.corpora.uni-hamburg.de/gui). Eine Kurzanleitung zum Suchen im Korpus mit ANNIS findet sich hier. Ein ausführlicheres Handbuch ist in Bearbeitung. Beispiele zur Nutzung von ANNIS anhand des ähnlich aufgebauten Referenzkorpus’ Mittelhochdeutsch finden sich bei Dipper (2015).

Bitte beachten Sie, dass die in ANNIS neben dem Korpusnamen angezeigte Zahl der Token nicht der tatsächlichen Tokenzahl entspricht, da zwei Tokenisierungsebenen verwendent werden. Um die korrekte Anzahl zu ermitteln, nutzen Sie bitte das Suchfeld in ANNIS und suchen dort nach der entsprechenden Tokenbezeichnung (z.B. „tok_dipl“ oder „tok_mod“) — die Anzahl der Treffer entspricht der Anzahl an Token.

Veröffentlichungsweise

Die Veröffentlichung des Korpus passiert sukzessive, d.h. sobald neue Texte vollständig bearbeitet sind, werden diese in einer neuen Korpusversion veröffentlicht. Jede dieser Versionen ist durch ein an den Korpusnamen angehängtes Datum identifizierbar. Mit Abschluß des Projektes wird eine finale Version publiziert. Alle Versionen werden mit einem persistent identifier (PID) versehen und durch das Hamburger Zentrum für Sprachkorpora (HZSK) verfügbar gehalten. Eine Auflistung aller bisherigen Korpusversionen finden Sie unten auf dieser Webseite.

Auch wenn die Bearbeitung der publizierten Texte grundsätzlich abgeschlossen ist, sind Fehlerkorrekturen in neueren Versionen nicht ausgeschlossen. Außerdem kann sich die Darstellung der Annotationen, beispielsweise die Benennung von Kategorien, ändern. Falls Sie als Nutzer des Referenzkorpus’ Hinweise zur Verbesserung des Designs haben, melden Sie sich gern bei Fabian Barteld aus dem Projektteam Hamburg. Noch nicht umgesetzt, aber für die Zukunft geplant, sind folgende Darstellungen/ Annotationen:

Die Korpusdaten sind in zwei Formaten verfügbar:

  1. relAnnis: Format zum direkten Import in ANNIS
  2. CorA-XML: Format des Annotationstools CorA

Für spätere Versionen ist außerdem die Veröffentlichung im TEI-Format geplant.

Korpusversionen