CLARIN-D Blog

Web-MAUS Evaluation und Dokumentation eines Integrationsprozesses anhand des ICE-Scotland Corpus - Simon Betz - Forum CA3

https://youtu.be/J-EjQU5JnKg

Simon Betz von der Universität Bielefeld stellt stellvertretend für die  F-AG 6 "Gesprochene Sprache und andere Modalitäten" das CLARIN Kurationsprojekt 3 vor. Hierbei handelt es sich um eine WebMAUS Evaluation anhand des ICE-Scotland Corpus. 

Die generellen Ziele des Kurationsprojektes waren 

  • Best Practice Guidelines für phonetische Anreicherung von Korpusdaten zu entwickeln und definieren
  • Zur Verbesserung von WebMAUS beitragende Tests und Vorschläge zu liefern, um systematische Fehler zu beheben
  • Ein reich annotiertes Sprachkorpus, welches Teil des International Corpus of English: Scotland ist, bereitzustellen
Weiterlesen

Multi-CAST - Prof. Dr. Geoffrey Haig - Forum CA3

 https://youtu.be/kxezf9VQdWU

Prof. Dr. Geoffrey Haig von der Universität Bamberg stellte auf dem Forum CA3 in Hamburg das in der CLARIN F-AG 3 "Linguistische Feldforschung, Ethnologie, Sprachtypologie" entstandene Multilingual Corpus of Annotated Spoken Text, kurz Multi-CAST vor. Der Forschungskontext innerhalb dessen Multi-CAST entstanden ist, ist Korpusbasierte Sprachtypologie. Was genau das heißt ist im Video und in diesem Blogpost zu sehen. 

Mit Sprachtypologie beziehen sich die Entwickler auf die Untersuchung der Gesamtheit aller möglicher menschlicher Sprachen, und das Identifizieren der Grenzen ihrer Variationen. Da es nicht möglich, ist alle Sprachen zu untersuchen, werden die Untersuchungen an einer möglichst ausgewogenen Stichprobe gemacht. Ausgewogen heißt hierbei, dass idealerweise möglichst weit entfernte Sprachen auszuwählen sind.

Weiterlesen

Empirische Grundlagen Der Linguistik - Dr. Marc Kupietz - Forum CA3

https://youtu.be/5aaqnj_DXI8

Dr. Marc Kupietz vom Mannheimer Institut für Deutsche Sprache (IDS) präsentiert auf dem Forum CA3 2016 in Hamburg DeReKo- das Deutsche Referenz Korpus, sowie die Korpus Analyse Platform KoRaP.

Seit 2004 wird am IDS das DeReKo aufgebaut und erweitert. Es soll als eine Art Ur-Stichprobe gegenwärtigen Sprachgebrauchs gelten und bietet unter anderem die Möglichkeit virtuelle Korpora zu definieren. Wichtig sind beim DeReKo nicht die relativen Größenverhältnisse einzelner Strata, sondern die ausreichende Streuung und Besetzung dieser. Zu den vorhandenen Strata gehören Texte aus der Belletristik, populärwissenschaftliche Texte wie Zeitschriften, konzeptuelle Schriften wie Polmine-Plenarprotokolle, sowie konzeptuelle Mündlichkeit im Bereich internetbasierter Kommunikation.

Weiterlesen

Digitale Geschichtswissenschaften - Prof. Dr. Simone Lässig - Forum CA3

https://youtu.be/s_haWGo9K_Y

Prof. Dr. Simone Lässig, Direktorin des Deutschen Historischen Instituts in Washington, spricht auf dem Forum CA3 über die transatlantische Sichtweise auf die Digital Humanities in Europa. Dies zeigt sie am Beispiel der Digitalen Geschichtswissenschaften.

Auch in Nordamerika sind die Digitalen Geisteswissenschaften mit mindestens 60 Zentren, Instituten und Laboren, ein großer Forschungszweig. Historiker und Historikerinnen wussten das Computerzeitalter bereits sehr früh, ca. ab den 1960er Jahren, zu nutzen. So entstanden viele neue Praktiken der Wissenserschließung und Wissensdistribution. Die Finanzierung beziehungsweise Förderung der Digitalen Geschichtswissenschaften geschieht durch staatliche Wissenschaftsförderung, Stiftungen, Unternehmen, die Regierung, große Forschungsuniversitäten, sowie deren private Geldgeber. Forschungs- und Organisationsformen beinhalten Querschnittdepartments von Universitäten, individuelle Forschende, Forschungsinstitute, DH-Zentren sowie DH-Labs. Die Nordamerikanische Forschung in diesem Bereich punktet also mit hoher Diversität in Finanzierung und Formaten. Um eine digitale Zukunft auch in der historischen Forschung sicherzustellen, ist es wichtig Veränderungen und neue Herausforderungen durch neue Arbeitsformen zu reflektieren.

Weiterlesen

DHA: Digital Humanities Austria - Vanessa Hannesschläger - Forum CA3

https://youtu.be/3UbMQI20_PA

Vanessa Hannesschläger von der Österreichischen Akademie der Wissenschaften stellte auf dem Forum CA3 in Hamburg das Netzwerk DHA (Digital Humanities Austria) vor. Ähnlich wie bei CLARIN-D ist das Ziel von DHA die Förderung und Unterstützung der Arbeit mit digitalen Ressourcen, die Inter- und Transdisziplinarität, sowie die Sicherstellung eines offenen Umgangs mit Forschungsdaten und Ergebnissen, die durch die Zusammenarbeit mehrerer Zentren sichergestellt werden soll. 

Weiterlesen

Unterrichtsdiskurs live - Prof. Dr. Angelika Redder auf dem Forum CA3

https://youtu.be/uUlMW72k4xU

Frau Prof. Dr. Angelika Redder von der Universität Hamburg spricht auf dem Forum CA3 in Hamburg über Möglichkeiten, wie der Unterricht mit Hilfe digitaler Sprachressourcen analysiert und verbessert werden kann. Zwei Projekte, die sich dieser Aufgabe annehmen und von Frau Redder in ihrem Vortrag vorgestellt werden, sind EuroWiss und MuM-Multi

Die wichtigsten Voraussetzungen, um einen Unterrichtsdiskurs erstellen zu können, ist ein integrales Transkriptsionssystem, ein komplexer Editor sowie konstellative Metadaten. Das Erfüllen dieser Voraussetzungen ermöglicht korpuslinguistische Arbeit, Diskursanalyse auf unterschiedlichen Ebenen, integrale Kommunikationsanalyse sowie das Erstellen von Aus- Fort- und Weiterbildungsmaterialien.

Weiterlesen

CLARIN in Europa - Prof. Dr. Franciska de Jong auf dem Forum CA3

https://youtu.be/qTMIT79svV8

Als Repräsentantin des CLARIN ERIC spricht Prof. Dr. Franciska de Jong von der Universität Utrecht auf dem Forum CA3 2016 in Hamburg über CLARIN als eine Forschungsinfrastruktur für ein multilinguales Europa.

Welche Probleme entstehen bei der Arbeit mit multilingualen Daten, Sprachwandel und Sprachvarietät und was bedeutet Multilingualität eigentlich? Diesen Fragen und deren Lösung durch eine Forschungsinfrastruktur die Wissen, Fachkenntnisse, Interoperabilität, Kooperationswillen und mehr verbindet, geht Frau Jong in ihrem Vortrag nach. 

Was ist Multilingualität und welche Herausforderungen und Perspektiven bringt sie für eine Forschungsinfrastruktur wie CLARIN mit sich?
Europa stellt mit seinen 24 Amtssprachen und diversen Dialekten ein Paradebeispiel multilingualen Zusammenlebens dar, welches für die meisten Menschen die Norm bildet. Die daraus entstehenden Herausforderungen und Perspektiven für eine Forschungsinfrastruktur sind beispielsweise

Weiterlesen

Digitale Sprachressourcen in der Lehrerbildung - Prof. Dr. Angelika Storrer - Forum CA3

https://youtu.be/ObaE1rYqcIs

Welche Möglichkeiten bieten digitale Sprachressourcen in der Lehrerbildung? Dieser Frage geht Prof. Dr. Angelika Storrer von der Universität Mannheim nach und teilte ihre diesbezüglichen Erfahrungen auf dem Forum CA3 in Hamburg.

Digitale Sprachressourcen wie Onlinewörterbücher, digitale Korpora und Werkzeuge zu deren Auswertung werden immer leistungsfähiger und können gut in die Lehrerbildung eingebunden werden. So können mit dem Gebrauch solcher Ressourcen beispielsweise Wörterbuchwerkstätten entwickelt werden, bei denen Studierende neben dem Nutzen der Korpora und entsprechender Werkzeuge auch erfahren können, welche Verfahren nötig sind um linguistisch annotierte Korpora zu erstellen. 

Weiterlesen

Förderung Fachlichen Lernens - Prof. Dr. Kristin Bührig - Forum CA3

https://youtu.be/NZGA07NsmlY

Prof. Dr. Kristin Bührig spricht auf dem Forum CA3 in Hamburg über das Projekt ProFaLe, die Professionalisierung von Lehrerhandlung mit Hinblick auf sprachliche und kulturelle Diversität. Der Schwerpunkt des Projekts liegt auf der Optimierung von Hochschullehre sowie Unterrichtsdiskursen unter dem Gesichtspunkt der sich verändernden gesellschaftlichen Bedingungen. 

Weiterlesen

Auswerten in CLARIN-D - Dr. Thomas Gloning - Forum CA3

https://youtu.be/SoLt7wnZJgY

Am Beispiel von Fragestellungen aus der germanistischen Sprachwissenschaft erläuterte Dr. Thomas Gloning von der Universität Giessen auf dem Forum CA3 2016 in Hamburg die Aufgabe des Auswertens mittels CLARIN Ressourcen. 

Zum Auswerten von Daten müssen wissenschaftliche Fragestellungen und digitale Angebote wie Werkzeuge oder Metadaten miteinander verknüpft, sowie unterschiedliche Ressourcen wie DTA und GermaNet verbunden werden.

CLARIN stellt drei Wege der Dokumentation der Auswertungen zur Verfügung

Weiterlesen