Kurationsprojekt zur Linguistische Annotation von Nichtstandardvarietäten — Guidelines und „Best Practices" (F-AG 7)

Projektinhalt

Das Kurationsprojekt zur Evaluation von Annotationsschemata für Nichtstandardvarietäten wurde im Juni 2012 genehmigt.

Aktuelle Schemata und Guidelines für linguistische Annotationen sind vorwiegend für die Beschreibung von Zeitungssprache entwickelt worden, und automatische Annotationstools werden nach wie vor weitgehend auf Zeitungssprache evaluiert. Im Kurationsprojekt geht es um die Erstellung annotierter Daten aus neuen Domänen, sogenannter "Nichtstandardvarietäten". Solche Daten enthalten eine Reihe sprachlicher Strukturen und Phänomene, die von gängigen Guidelines nicht abgedeckt werden.

Das genehmigte Kurationsprojekt wird in einer Pilotstudie gängige Annotationsschemata für drei Annotationsebenen (Dependenzanalyse, Named Entity Recognition, Koreferenz) evaluieren und gegebenenfalls erweitern. Dazu wird ein Testkorpus nichtstandardsprachlicher Varietäten erstellt und annotiert. Ziel sind Guidelines und „Best practices" für die Annotation solcher Varietäten.

Laufzeit

  • 01.09.2012 – 30.09.2013

Antragsteller

Verantwortliche Institution

  • Institut für deutsche Sprache und Linguistik, Humboldt-Universität zu Berlin
  • Sprachwissenschaftliches Institut, Ruhr-Universität Bochum

Ausführende Mitarbeiter