Konstruktionsgrammatik - Sprachgebrauchsbasierte Analysen mit den Korpora des DWDS und des DTA

https://youtu.be/wgmzrT9UJxQ

Prof. Dr. Alexander Lasch, Linguist an der TU Dresden, zeigt in diesem Video, wie mit den Ressourcen des DTA und des DWDS sprachgebrauchsbasierte Analysen durchgeführt werden können, um das Deutsche konstruktionsgrammatisch zu beschreiben. Dafür stellt er zwei Leitfragen auf: 

  1. Kann mittels eines konstruktionsgrammatischen Ansatzes Sprachgebrauch gegenstandsadäquat beschrieben werden?
  2. Inwieweit können maschinelle Analysen des Sprachgebrauchs dazu dienen, den sprachgebrauchsbasierten konstruktionsgrammatischen Ansatz zu plausibilisieren?  

Ein sprachgebrauchsbasierter Zugang verlangt die Diskussion darüber, was für uns ein Muster, Pattern, Schema oder eine Konstruktion sei, wovon sowohl die Grammatik des Deutschen, als auch die Konstruktionsgrammatik als Teilgebiet unter spezifischen kognitionslinguistischen Prämissen profitieren können. Der aktuelle Trend ist die Ermittlung solcher Muster durch maschinelle Analysen. Diese Muster werden dann im nächsten Schritt abstrahiert, um aus ihnen Konstruktionen zu gewinnen. Durch diese Vorgehensweise soll Sprachwissen, welches Sprechende zur Produktion der sprachlichen Strukturen verwenden, aus Sprachgebrauch rekonstruiert werden. Für diese Arbeit bieten das DWDS und das DTA gute Mittel.

Die jeweiligen Korpusdaten müssen hierfür sehr genau durchsucht werden, und es sollte bereits im Vorfeld klar sein, nach welchen sprachlichen Strukturen gesucht wird und wie diese beschrieben werden sollen, um die Suchstrings entsprechend anzupassen. Als Beispiel dafür, dass dieser Schritt unumgänglich ist, gibt Lasch die drei folgenden Suchstrings an, die allesamt das Partizip Perfekt im Mittelpunkt ihrer Suchanfrage haben, doch zu Ergebnissen mit kleinen Unterschieden führen: 

  1. near(erscheinen, $p=VVPP,10)
  2. "@erscheint #10 $p=VVPP"&&!\,&&!@zu
  3. "$p=VVPP #0 @erscheint" &&!@zu

Eine erste Annäherung an das zu untersuchende Phänomen lässt sich mit einem Suchstring wie unter (a) vornehmen. Abgesucht wird hier der Bereich nach dem Auftreten des Wortes erscheinen als Verb und einem Partizip Perfekt in einem Bereich von 10 Einheiten. Nicht berücksichtigt werden hierbei Spezifika wie Satzzeichen, und ob das Partizip Perfekt und das gesucht Wort gemeinsam in einem satzwertigen Ausdruck auftreten. 

Suchstring (b) enthält bereits spezifischere Abfragemittel, mit denen Verbzweitstellung im Hauptsatz, eine spezifizierte Form des Wortes erscheinen, in der 3. Person Singular Präsens beziehungsweise 2. Person Plural Präsens, und ein Wortabstand von 10 zum Partizip Perfekt die Bedingungen sind. Nicht in die Suchanfrage eingeschlossen sind Kommata als Satzzeichen und zu für einen etwaigen erweiterten Infinitiv. 

Mit Suchstring (c) wird ganz spezifisch nach der Wortreihenfolge eines Partizip Perfekts im Wortabstand 0 zu erscheinen in der 3. Person Singular Präsens beziehungsweise der 2. Person Plural Präsens in Verbletztstellung im Nebensatz und ohne ein Auftreten des Elements zu für den erweiterten Infinitiv gesucht. 

Die Ergebnisse aller drei dieser und ähnlicher Suchanfragen können sowohl im DWDS als auch im DTA als tab separated files ausgegeben werden, welche sich widerum einfach in Tabellenkalukationen weiterverarbeiten lassen. So lassen sich beispielsweise Belegdaten halbautomatisch Zählen, die für das Partizip Perfekt aufgefunden und widerum gezählt und ausgewertet werden können. Andererseits können auch unterschiedliche Auftretensformen nach Dekaden gezählt werden. Diese sind im DWDS unterschiedlich Gewichtet und müssen durch Normalisierung des Korpus herausgerechnet werden. Ist das Ziel der Suche eine saubere Differenzierung zwischen Verbletzt- und Verbzweitstellung kann dies hilfreich sein. Ist das Ergebnis einer solchen Suche nun, dass erscheinen im Präteritum favorisiert in Verbletztstellung verwendet wurde, wäre zu klären weshalb dies der Fall ist und welche Rückschlüsse daraus auf die Konstruktionsbedeutung zu ziehen wären. 

Weitere Differenzierungsmöglichkeiten wären die Untersuchung einzelner Vorkommen des Verbs erscheinen in unterschiedlichen Kommunikationsdomänen oder die Frage, welche Partizip Perfekte beziehungsweise Adjektive gemeinsam auftreten können, und dies auch besonders häufig tun. So tritt erscheinen in wissenschaftlichen Texten besonders häufig mit Wörtern wie (erscheint) gesichert, selbstverständlich, verbunden oder zweckmäßig auf. In Zeitungsartikeln auf der anderen Seite tritt das Wort häufiger mit Wörtern wie ausgeschlossen oder notwendig auf. Es wäre noch zu überprüfen, ob sich der Unterschied des Auftretens von erscheinen gemeinsam mit ausgeschlossen signifikant vom Auftreten von erscheinen in anderen Konstruktionen unterscheidet, beziehungsweise wie statistisch signifikant diese Konstruktion überhaupt ist. 

Welche Ergebnisse können also aus einer solchen ersten Annäherung mit maschinellen Analysen über das DWDS oder das DTA erzielt werden? 

  • Beschreibung von Belegvorgkommen unter Berücksichtigung der Spezifika der genutzten Korpora können vorgenommen werden
  • Prototypischer Strukturen für spezifische Kommunikationsdomänen können wermittelt werden, d.h. die Beantwortung der Frage, in welchen Kommunikationsdomänen diese Konstruktionen hochfrequent auftreten. Diese Untersuchungen erlauben Aussagen über die Konstruktionsbedeutung
  • Grammatische Strukturen können aus dem Sprachgebrauch heraus beschrieben werden, wodurch neue Kategorisierungen vorangetrieben werden können 
  • Der konstruktionsgrammatische Ansatz für den Sprachgebrauch kann überprüft werden. Tritt man bei der Analyse vor sprachliche Erscheinungen, die sich konstruktionsgrammatisch nicht beleuchten lassen, könnte dies zu neuen Erkentnissen führen und die Diskussion und Einsichten in diesen Bereich in den nächsten Jahren noch weiter vorantreiben

Bisher nicht gelöste Probleme sind die Phänomene der Reflexivität, der Negation, der Modalkonstruktionen sowie des Tempus, die allesamt durch die Arbeit mit dem DWDS und DTA zu lösen wären.  

Es ist für Prof. Dr. Lasch wichtig, dass Ergebnisse aus wissenschaftlichen Untersuchungen innerhalb der Community sichtbar und direkt anschlussfähig sind, damit andere Wissenschaftler und Wissenschaftlerinnen diese unmittelbar nachvollziehen könnnen. Aus seiner Sicht wird darauf innerhalb der Community zu wenig geachtet, doch er sieht durch die Arbeit mit DWDS und DTA eine gute Umgebung dafür. Auch er hat den kompletten Datensatz seiner Habilitationsschrift hier zur freien Verfügung gestellt. Weitere Informationen sind hier zu finden. 

Geschrieben von : Sarah Schneider

Gravatar
Alexander Lasch
Annotation der Belegdaten
Eines ist mir noch wichtig: In der Belegübersicht am Schluss werden Qualitative (also VVPP und ADJ) separat ausgewiesen. Das ist keine Kategorisierung , die ich vorgenommen habe, sondern entspricht der Annotation in DWDS bzw. DTA. Neben den beschriebenen Suchstrings wären also auch noch separate Strings mit Elementen der Wortart Adjektiv zu nutzen, wie man in den Ergebnissen sieht.

1000 Buchstaben übrig