CLARIN-D Blog

Konstruktionsgrammatik - Sprachgebrauchsbasierte Analysen mit den Korpora des DWDS und des DTA

https://youtu.be/wgmzrT9UJxQ

Prof. Dr. Alexander Lasch, Linguist an der TU Dresden, zeigt in diesem Video, wie mit den Ressourcen des DTA und des DWDS sprachgebrauchsbasierte Analysen durchgeführt werden können, um das Deutsche konstruktionsgrammatisch zu beschreiben. Dafür stellt er zwei Leitfragen auf: 

  1. Kann mittels eines konstruktionsgrammatischen Ansatzes Sprachgebrauch gegenstandsadäquat beschrieben werden?
  2. Inwieweit können maschinelle Analysen des Sprachgebrauchs dazu dienen, den sprachgebrauchsbasierten konstruktionsgrammatischen Ansatz zu plausibilisieren?  

Ein sprachgebrauchsbasierter Zugang verlangt die Diskussion darüber, was für uns ein Muster, Pattern, Schema oder eine Konstruktion sei, wovon sowohl die Grammatik des Deutschen, als auch die Konstruktionsgrammatik als Teilgebiet unter spezifischen kognitionslinguistischen Prämissen profitieren können. Der aktuelle Trend ist die Ermittlung solcher Muster durch maschinelle Analysen. Diese Muster werden dann im nächsten Schritt abstrahiert, um aus ihnen Konstruktionen zu gewinnen. Durch diese Vorgehensweise soll Sprachwissen, welches Sprechende zur Produktion der sprachlichen Strukturen verwenden, aus Sprachgebrauch rekonstruiert werden. Für diese Arbeit bieten das DWDS und das DTA gute Mittel.

Weiterlesen

DHA: Digital Humanities Austria - Vanessa Hannesschläger - Forum CA3

https://youtu.be/3UbMQI20_PA

Vanessa Hannesschläger von der Österreichischen Akademie der Wissenschaften stellte auf dem Forum CA3 in Hamburg das Netzwerk DHA (Digital Humanities Austria) vor. Ähnlich wie bei CLARIN-D ist das Ziel von DHA die Förderung und Unterstützung der Arbeit mit digitalen Ressourcen, die Inter- und Transdisziplinarität, sowie die Sicherstellung eines offenen Umgangs mit Forschungsdaten und Ergebnissen, die durch die Zusammenarbeit mehrerer Zentren sichergestellt werden soll. 

Weiterlesen

CLARIN in Europa - Prof. Dr. Franciska de Jong auf dem Forum CA3

https://youtu.be/qTMIT79svV8

Als Repräsentantin des CLARIN ERIC spricht Prof. Dr. Franciska de Jong von der Universität Utrecht auf dem Forum CA3 2016 in Hamburg über CLARIN als eine Forschungsinfrastruktur für ein multilinguales Europa.

Welche Probleme entstehen bei der Arbeit mit multilingualen Daten, Sprachwandel und Sprachvarietät und was bedeutet Multilingualität eigentlich? Diesen Fragen und deren Lösung durch eine Forschungsinfrastruktur die Wissen, Fachkenntnisse, Interoperabilität, Kooperationswillen und mehr verbindet, geht Frau Jong in ihrem Vortrag nach. 

Was ist Multilingualität und welche Herausforderungen und Perspektiven bringt sie für eine Forschungsinfrastruktur wie CLARIN mit sich?
Europa stellt mit seinen 24 Amtssprachen und diversen Dialekten ein Paradebeispiel multilingualen Zusammenlebens dar, welches für die meisten Menschen die Norm bildet. Die daraus entstehenden Herausforderungen und Perspektiven für eine Forschungsinfrastruktur sind beispielsweise

Weiterlesen

Förderung Fachlichen Lernens - Prof. Dr. Kristin Bührig - Forum CA3

https://youtu.be/NZGA07NsmlY

Prof. Dr. Kristin Bührig spricht auf dem Forum CA3 in Hamburg über das Projekt ProFaLe, die Professionalisierung von Lehrerhandlung mit Hinblick auf sprachliche und kulturelle Diversität. Der Schwerpunkt des Projekts liegt auf der Optimierung von Hochschullehre sowie Unterrichtsdiskursen unter dem Gesichtspunkt der sich verändernden gesellschaftlichen Bedingungen. 

Weiterlesen

Auffinden in CLARIN-D - Dr. Alexander Geyken - Forum CA3

https://youtu.be/HCXjWryIxZY

Dr. Alexander Geyken von der Berlin Brandenburgischen Akademie der Wissenschaften spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Auffindens innerhalb unserer Forschungsinfrastruktur. Als Beispielressource verwendet er hierfür historische Texte. 

Für die Datensuche gibt es über CLARIN-D drei Möglichkeiten:

  • Metadatensuche mittels des Virtual Language Observatorys (VLO)
    Das VLO ermöglicht innerhalb aller CLARIN Ressourcen zu suchen. Die Suche kann hierbei präzisiert werden, indem direkt nach speziellen Sprachen, Kollektionen, Ressourcentypen, Modalitäten, Genre und mehr gesucht wird
  • Volltextsuche sowie
  • über die CLARIN Zentren 
Weiterlesen

Aufbewahren in CLARIN-D - Dr. Thorsten Trippel - Forum CA3

https://youtu.be/Msqm1EFybM4

Dr. Thorsten Trippel von der Universität Tübingen, Liaison Koordinator des Projektverbunds CLARIN-D, spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Aufbewahrens von Daten innerhalb der Forschungsinfrastruktur CLARIN-D.

Gründe für Datenaufbewahrung sind

  1.  Sicherung der guten wissenschaftlichen Praxis
  2.  Nachnutzung von Forschungsdaten und
  3.  Attribution andersartiger wissenschaftlicher Leistung
Weiterlesen

CLARIN Federated Content Search: Suche in verteilten Sprachressourcen

https://youtu.be/SaUJVdfz1CA

In diesem Screencast stellen wir unser Werkzeug CLARIN Federated Content Search (FCS) vor. Es ermöglicht eine Suche nach unterschiedlichen Verwendungen eines Wortes in verteilten Sprachressourcen. Hierfür kann ein beliebiger Begriff in die Suchmaske eingegeben werden. um ihn entweder Sprachunabhängig oder in einer bestimmten Sprache darzustellen. Auch die Art der Darstellung lässt sich manuell festlegen.  

Eine dieser Darstellungsformen, die auch in diesem Screencast gezeigt wird, ist KWIC - also Keyword in Context. Hierbei wird das Wort in verschiedenen möglichen Kontexten dargestellt. 

Weiterlesen

Wo sagt man ... ?

  https://youtu.be/gJo_eGbEQ0I

Besonders interessant für Dialektforschende und RegionalhistorikerInnen ist das in diesem Screencast vorgestellte Werkzeug "Wo sagt man?". Es ermöglicht Nutzenden nach Ausdrücken zu suchen und visualisiert die Bereiche auf einer Karte, in denen dieser Ausdruck verwendet wird, beziehungsweise wo er aufgenommen wurde und liefert weitere Informationen dazu. 

Weiterlesen

Automatische Annotation von Namen

https://youtu.be/OtDTtpMnzdk

Bücher, Artikel und Manuskripte enthalten oft Angaben zu Personen, Orten und Organisationen. Um sich einen Überblick über diese Angaben zu verschaffen ist ein automatisches Werkzeug wie ein Named-Entity-Recognizer sinnvoll, mit dessen Hilfe Namen markiert und kategorisiert werden können. Gerade bei längeren Texten erhält man dadurch einen guten Überblick, häufig sieht man sogar Namen, Orte und Einrichtungen, die man beim Lesen übersehen hätte.

Mit Hilfe des Tools WebLicht, welches einen Named Entity Recognizer für mehrere Sprachen enthält, können diese Informationen automatisch markiert und extrahiert werden. Sie müssen sich lediglich mit Ihrem CLARIN-Account oder dem Zugang Ihrer Heimatinstitution einloggen und können dann Ihren Text eingeben, hochladen oder einen Beispieltext auswählen. Der nächste Schritt ist die Zusammenstellung Ihrer Prozesskette. Um dies tun zu können klicken Sie im nächsten Schritt auf "Advanced Mode".   

Weiterlesen

DiaCollo Screencast

https://youtu.be/_0HdBPoajZA

Dieser Screencast zeigt die Verwendung des Werkzeugs "DiaCollo: Kollokationsanalyse in diachroner Perspektive". 

Der Kontext eines Wortes, in diesem Fall seine Kollokationen, kann Aufschluss über Bedeutung des Wortes oder Bedeutungswandel geben. Ebenso können politische, kulturelle oder gesellschaftliche Veränderungen mittels der Kollokationen eines Wortes aufgefunden werden. 

Weiterlesen