CLARIN-D Blog

Web-MAUS Evaluation und Dokumentation eines Integrationsprozesses anhand des ICE-Scotland Corpus - Simon Betz - Forum CA3

https://youtu.be/J-EjQU5JnKg

Simon Betz von der Universität Bielefeld stellt stellvertretend für die  F-AG 6 "Gesprochene Sprache und andere Modalitäten" das CLARIN Kurationsprojekt 3 vor. Hierbei handelt es sich um eine WebMAUS Evaluation anhand des ICE-Scotland Corpus. 

Die generellen Ziele des Kurationsprojektes waren 

  • Best Practice Guidelines für phonetische Anreicherung von Korpusdaten zu entwickeln und definieren
  • Zur Verbesserung von WebMAUS beitragende Tests und Vorschläge zu liefern, um systematische Fehler zu beheben
  • Ein reich annotiertes Sprachkorpus, welches Teil des International Corpus of English: Scotland ist, bereitzustellen
Weiterlesen

Empirische Grundlagen Der Linguistik - Dr. Marc Kupietz - Forum CA3

https://youtu.be/5aaqnj_DXI8

Dr. Marc Kupietz vom Mannheimer Institut für Deutsche Sprache (IDS) präsentiert auf dem Forum CA3 2016 in Hamburg DeReKo- das Deutsche Referenz Korpus, sowie die Korpus Analyse Platform KoRaP.

Seit 2004 wird am IDS das DeReKo aufgebaut und erweitert. Es soll als eine Art Ur-Stichprobe gegenwärtigen Sprachgebrauchs gelten und bietet unter anderem die Möglichkeit virtuelle Korpora zu definieren. Wichtig sind beim DeReKo nicht die relativen Größenverhältnisse einzelner Strata, sondern die ausreichende Streuung und Besetzung dieser. Zu den vorhandenen Strata gehören Texte aus der Belletristik, populärwissenschaftliche Texte wie Zeitschriften, konzeptuelle Schriften wie Polmine-Plenarprotokolle, sowie konzeptuelle Mündlichkeit im Bereich internetbasierter Kommunikation.

Weiterlesen

Auffinden in CLARIN-D - Dr. Alexander Geyken - Forum CA3

https://youtu.be/HCXjWryIxZY

Dr. Alexander Geyken von der Berlin Brandenburgischen Akademie der Wissenschaften spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Auffindens innerhalb unserer Forschungsinfrastruktur. Als Beispielressource verwendet er hierfür historische Texte. 

Für die Datensuche gibt es über CLARIN-D drei Möglichkeiten:

  • Metadatensuche mittels des Virtual Language Observatorys (VLO)
    Das VLO ermöglicht innerhalb aller CLARIN Ressourcen zu suchen. Die Suche kann hierbei präzisiert werden, indem direkt nach speziellen Sprachen, Kollektionen, Ressourcentypen, Modalitäten, Genre und mehr gesucht wird
  • Volltextsuche sowie
  • über die CLARIN Zentren 
Weiterlesen

Digital Humanities studieren und netzwerken mit CLARIN

Digital Humanities studieren und netzwerken mit CLARIN

Man nehme 70 internationale Nachwuchswissenschaftler aus den Digital Humanities (DH), 11 verschiedene Kurse von erfahrenen Experten, und einige Präsentationen von Forschenden zu ihrer Arbeit in verschiedenen DH-Bereichen. Man füge ein Rahmenprogramm hinzu, das Exkursionen zu Museen und Kulturstätten beinhaltet und voilà: Im Sommer 2017 war die „Europäische Sommeruniversität- Kulturen und Technologien“ (ESU) ein perfekter Treffpunkt für Forschende, um DH-Methoden zu erlernen und anzuwenden, ihren Horizont um verschiedene DH-Forschungsfragen zu erweitern und ein internationales Netzwerk an Expertise aufzubauen.

Weiterlesen

Metadaten im CMDI-Format erstellen

Metadaten im CMDI-Format erstellen

Wenn bei uns im Haus im Rahmen von Forschungsarbeiten Ressourcen wie Tools oder Korpora entstehen, sind wir als Metadaten-Team eine erste Anlaufstelle: Wir unterstützen die Forschenden bei der Erstellung von CMDI-Dokumenten zur nachhaltigen Beschreibung der Ressourcen. Zum Team gehören immer ein bis zwei studentische Hilfskräfte, die nach einer kurzen Einarbeitungszeit selbstständig Vorschläge für Metadatenentwürfe zu den Ressourcen erarbeiten. Wir sind natürlich immer ansprechbar, wenn eine neue Ressource erstellt wird, suchen aber auch regelmäßig auf den Webseiten des Instituts, den Projekt- und Mitarbeiterseiten nach noch nicht beschriebenen Ressourcen.

Weiterlesen