Archive

Im Folgenden werden die Sprachdaten-Archive der CLARIN-D-Zentren vorgestellt.

Ein Sprachdaten-Archiv ist eine thematisch heterogene Sammlung von Sprachdaten mit dem primären Zweck, diese Daten auf einem langlebigen Medium zu erhalten und dem sekundären Zweck, sie der Öffentlichkeit zur Verfügung zu stellen.


Bayerisches Archiv für Sprachsignale, München:

BAS: LogoDas Bayerische Archiv für Sprachsignale (BAS) wurde im Januar 1995 als öffentliche Einrichtung an der Ludwig Maximilians Universität München gegründet. Das BAS befindet sich derzeit am Institut für Phonetik und Sprachverarbeitung (IPS). Zentrale Aufgabe des BAS ist es, digitale Datenbasen mit gesprochenem Deutsch in strukturierter Form sowohl der Forschungsgemeinschaft als auch der Sprachtechnologie verfügbar zu machen.

Abgesehen vom Gesamtkatalog der im BAS verfügbaren Ressourcen betreibt das BAS ein CLARIN zertifiziertes Repository von frei zugänglichen Sprachkorpora für akademische Nutzer, sowie eine Reihe von webbasierten und stand-alone Werkzeugen zur Verarbeitung gesprochener Sprache.


Institut für Deutsche Sprache, Mannheim:

AGD: LogoDas Archiv für Gesprochenes Deutsch (AGD) archiviert die bei Spracherhebungen und in Forschungsprojekten erstellten Korpora von gesprochenem Deutsch und stellt sie der Forschung für die weitere wissenschaftliche Auswertung zur Verfügung. In der Datenbank Gesprochenes Deutsch (DGD) kann über einen großen Teil der Korpus-Dokumentationen recherchiert werden. Außerdem besteht die Möglichkeit, in den Transkripten nicht nur nach Worten, sondern auch nach komplexen Wortkombinationen zu suchen und dank des Text-Ton-Alignments die gefundenen Belegstellen sofort anzuhören.


Max-Planck-Institut für Psycholinguistik, Nijmegen:

TLA: LogoDas Spracharchiv ("The Language Archive") am Max Planck Institut für Psycholinguistik enthält audiovisuelle Aufnahmen und Schriftmaterial von über 250 verschiedenen Sprachen. Das DoBeS-Archiv, Teil des Förderungsprogramms zur Dokumentation bedrohter Sprachen, ist ein Teil davon, aber das Archiv enthält z.B. auch Material über Spracherwerbsstudien, Studien über Gebärdensprache und Mehrsprachigkeitsstudien.

Das Archiv verwendet ein mehrstufiges System zur Zugriffssteuerung, das es den Forschern, die das Material archiviert haben, ermöglicht für verschiedene Teile ihres Korpus unterschiedliche Zugriffsregelungen einzustellen. Die verschiedenen Zugriffsebenen für Ressourcen sind: komplett frei zugänglich, zugänglich für alle registrierten Nutzer, Zugriff auf Anfrage und komplett unzugänglich. Nutzer von "Digging into Data" erhalten Zugriff auf die Daten der ersten beiden Kategorien, indem sie sich hier registrieren. Eine Anfrage beim entsprechenden Forscher für Zugriff für die dritte Kategorie kann innerhalb des Archivs dadurch gestellt werden, dass man in der Nutzeroberfläche einen Rechtsklick auf den entsprechenden Teil des Archivs ausführt und "request resource access" auswählt. Dann erscheint ein Formular, das ausgefüllt werden kann. Als Teil der Registrierung muß einem Verhaltenskodex (Code of Conduct, auf Englisch) zugestimmt werden.

Für weitere Informationen über das Archiv oder Details bezüglich des Zugriffs auf spezifisches Material kontaktieren Sie bitte Paul.Trilsbeek[AT]mpi.nl

Der Metadaten-Katalog von "The Language Archive" ist über das Internet hier zu erreichen.