Auffinden

Auffinden

Auswerten

Auswerten

Aufbereiten und Aufbewahren

Aufbereiten

 

Mehr

Mehr

Hilfe

CLARIN hilft

Mehr erfahren

CLARIN-D Blog

Vom Korpus zum Netz - Prof. Dr. Christian Mair - Forum CA3

Prof. Dr. Christian Mair von der Universität Freiburg geht in seiner Präsentation auf dem Forum CA3 in Hamburg auf die Entwicklungen bezüglich des Community Buildings innerhalb von Forschungsinfrastrukturen wie CLARIN-D ein. In den letzten 50 Jahren gab es bezüglich des Nutzerkreises digitaler Sprachdaten große Veränderungen. Wo früher noch ausschließlich kleine Expertenzirkel ihr Wissen unter sich verbreiteten, wird dies nun mehr und mehr zur massenhaft verbreiteten Kulturtechnik. Die Community, die sich um einen Wissenskreis bildet, ist also nicht mehr so eindeutig abgrenzbar wie früher. Dies liegt in erste Linie an der breiten Digitalisierung der linguistischen Daten wie Schrifttexten, die nun multimodal und multimedial gestaltet werden und somit ein größeres Publikum bedienen können. Des Weiteren werden Texte nicht mehr nur noch gelesen, sondern in Datenform nutztbar gemacht und genutzt. 

Weiterlesen

Analyse von 'sprich' unter Verwendung der DGD und FOLK

In diesem Screencast wird anhand der Datenbank für Gesprochenes Deutsch (DGD) gezeigt, wie Gesprächslinguistische Phänomene datenbankgestützt aufgezeigt und analysiert werden können. Hierfür wird das Forschungs- und Lehrkorpus gesprochenes Deutsch (FOLK) genutzt. Das untersuchte Wort ist sprich in seiner Verwendungsweise als Reformulierungsindikator, in dem es eine ähnliche Funktion wie das heißt hat und von seiner ursprünglichen imperativen Form entfremdet ist.  

Bei welchen Fragestellungen ist eine solche datenbankgestützte Analyse hilfreich? 

  • Finden sich Kookkurrenzen mit anderen Reformulierungsindikatoren wie also oder das heißt?
  • In welchen Interaktionstypen findet sich sprich häufiger und lassen entsprechende Tendenzen weitere Schlussfolgerungen bezüglich der Funktionalität zu? 
  • Welche grammatischen, semantischen und funktionalen Elemente werden durch sprich miteinander verknüpft und in welchem Verhältnis stehen diese? 
Weiterlesen

WebLicht Experteninterview - Extraktion Prädikativer Nominalphrasen

In diesem Experteninterview wird ein Anwendungsszenario von CLARINs WebLicht besprochen. Genau wird gezeigt, wie prädikativ verwendete Nominalphrasen mittels WebLicht aus literarischen Texten extrahiert werden können. Der Forschungskontext innerhalb dessen diese Arbeitsweise genutzt wurde waren Formen und Funktionen von NPs beim Entwurf literarischer Figuren

Bei prädikativ verwendeten NPs im literarischen Kontext handelt es sich zum Beispiel um Charakterisierungen, wie die im folgenden Textausschnitt aus Thomas Manns Mario und der Zauberberg fett markierte Stelle: 

Ohne Schwierigkeiten fand sich ein junger Mann aus den hinteren Sitzreihen, der bereit war, diktierte Ziffern auf die Tafel zu schreiben. Wir kannten ihn auch: die ganze Unterhaltung gewann etwas Familiärs dadurch, dass man so viele Gesichter kannte. Er war der Angestellte des Kolonialwaren- und Obstladens in der Hauptstraße und hatte uns mehrmals in guter Form bedient. 
Mann 1930: 61
 

Weiterlesen

COSMAS II Screencast

In diesem Screencast wird eine Nutzungsmöglichkeit von COSMAS II gezeigt. COSMAS, das Corpus Search, Management and Analysis System, ist ein Portal für Korpusrecherchen innerhalb textueller Korpora des IDS. Als Beispiel wird die Untersuchung der Entwicklung des öffentlichen Diskurses über Geflüchtete gezeigt

Es wird im Detail gezeigt, welche Schritte für eine solche Analyse in COSMAS II vorgenommen werden müssen. So muss zunächst ein für den Forschungskontext geeignetes Teilkorpus zusammengestellt werden. Hierfür muss nach einer Anmeldung in COSMAS II ein Textarchiv ausgewählt werden. Im Screencast wird beispielsweise das Archiv für geschriebene Sprache ausgewählt. Als Textkorpus werden Texte aus der Zeitung Die Zeit zwischen 1953 und 2015 ausgewählt.

Weiterlesen

Integrationspolitik im Bundesländervergleich - Prof. Dr. Andreas Blätte - Forum CA3

Prof. Dr. Andreas Blätte von der Universität Duisburg-Essen beginnt seinen Vortrag auf dem Forum CA3 in Hamburg mit der Frage, ob ein Bundesintegrationsministerium geschaffen werden soll. In größerem wissenschaftlichem Kontext eingebettet lässt sich die Frage stellen, wie die Schaffung von Integrationministerien die Aufmerksamkeitsstruktur für das Thema Integration beeinflusst. 

Herr Blätte stellt folgende Thesen bezüglich der Effekte, die ein Integrationsministerium haben könnte, und für die Korpora von Nöten sind, auf: 

  • Ausdifferenzierungsthese
    Es bildet sich ein ausdifferenzierter Bereich der Integrationspolitik, andere Bereiche werden so entlastet
  • Mobilisierungsthese
    Der Integrationsminister trägt die Verantwortung dafür zu sorgen, dass die Kabinettsmitglieder ihre Aufgaben im Integrationsbereich erfüllen  
  • Mehrebeneneffekte
    Ein Land, welches ein Integrationsministerium hat, könnte eine Vorbildrolle für andere Länder und/oder den Bund bilden 
  • Leitbildthese
    Entwicklungen in größeren Bereichen, denen sich Bund und Länder nicht weiter entziehen können, und die Institutsunabhängig sind  
Weiterlesen

Semantische Annotation - Éva Mújdricza-Maydt und Dr. Richard Eckart de Castilho - Forum CA3

Éva Mújdricza-Maydt und Dr. Richard Eckart de Castilho stellen auf dem Forum CA3 in Hamburg die Ergebnisse des Kurationsprojektes 3 "Semantische Annotation für Digital Humanities", das innerhalb der F-AG 7 "Inhaltsanalytische Methoden in den Sozialwissenschaften" entstanden ist, vor. 

Das Projekt verfolgte zweierlei Ziele. Zum Einen die semantische Annotation deutscher Korpora, um diese als weiterverwendbare Ressource zur Verfügung zu stellen, und zum anderen die Optimierung des Annotationstools WebAnno für Aufgaben innerhalb und außerhalb des linguistischen Kontextes. 

Weiterlesen

Web-MAUS Evaluation und Dokumentation eines Integrationsprozesses anhand des ICE-Scotland Corpus - Simon Betz - Forum CA3

Simon Betz von der Universität Bielefeld stellt stellvertretend für die  F-AG 6 "Gesprochene Sprache und andere Modalitäten" das CLARIN Kurationsprojekt 3 vor. Hierbei handelt es sich um eine WebMAUS Evaluation anhand des ICE-Scotland Corpus. 

Die generellen Ziele des Kurationsprojektes waren 

  • Best Practice Guidelines für phonetische Anreicherung von Korpusdaten zu entwickeln und definieren
  • Zur Verbesserung von WebMAUS beitragende Tests und Vorschläge zu liefern, um systematische Fehler zu beheben
  • Ein reich annotiertes Sprachkorpus, welches Teil des International Corpus of English: Scotland ist, bereitzustellen
Weiterlesen

Multi-CAST - Prof. Dr. Geoffrey Haig - Forum CA3

Prof. Dr. Geoffrey Haig von der Universität Bamberg stellte auf dem Forum CA3 in Hamburg das in der CLARIN F-AG 3 "Linguistische Feldforschung, Ethnologie, Sprachtypologie" entstandene Multilingual Corpus of Annotated Spoken Text, kurz Multi-CAST vor. Der Forschungskontext innerhalb dessen Multi-CAST entstanden ist, ist Korpusbasierte Sprachtypologie. Was genau das heißt ist im Video und in diesem Blogpost zu sehen. 

Mit Sprachtypologie beziehen sich die Entwickler auf die Untersuchung der Gesamtheit aller möglicher menschlicher Sprachen, und das Identifizieren der Grenzen ihrer Variationen. Da es nicht möglich, ist alle Sprachen zu untersuchen, werden die Untersuchungen an einer möglichst ausgewogenen Stichprobe gemacht. Ausgewogen heißt hierbei, dass idealerweise möglichst weit entfernte Sprachen auszuwählen sind.

Weiterlesen

Empirische Grundlagen Der Linguistik - Dr. Marc Kupietz - Forum CA3

Dr. Marc Kupietz vom Mannheimer Institut für Deutsche Sprache (IDS) präsentiert auf dem Forum CA3 2016 in Hamburg DeReKo- das Deutsche Referenz Korpus, sowie die Korpus Analyse Platform KoRaP.

Seit 2004 wird am IDS das DeReKo aufgebaut und erweitert. Es soll als eine Art Ur-Stichprobe gegenwärtigen Sprachgebrauchs gelten und bietet unter anderem die Möglichkeit virtuelle Korpora zu definieren. Wichtig sind beim DeReKo nicht die relativen Größenverhältnisse einzelner Strata, sondern die ausreichende Streuung und Besetzung dieser. Zu den vorhandenen Strata gehören Texte aus der Belletristik, populärwissenschaftliche Texte wie Zeitschriften, konzeptuelle Schriften wie Polmine-Plenarprotokolle, sowie konzeptuelle Mündlichkeit im Bereich internetbasierter Kommunikation.

Weiterlesen

Digitale Geschichtswissenschaften - Prof. Dr. Simone Lässig - Forum CA3

Prof. Dr. Simone Lässig, Direktorin des Deutschen Historischen Instituts in Washington, spricht auf dem Forum CA3 über die transatlantische Sichtweise auf die Digital Humanities in Europa. Dies zeigt sie am Beispiel der Digitalen Geschichtswissenschaften.

Auch in Nordamerika sind die Digitalen Geisteswissenschaften mit mindestens 60 Zentren, Instituten und Laboren, ein großer Forschungszweig. Historiker und Historikerinnen wussten das Computerzeitalter bereits sehr früh, ca. ab den 1960er Jahren, zu nutzen. So entstanden viele neue Praktiken der Wissenserschließung und Wissensdistribution. Die Finanzierung beziehungsweise Förderung der Digitalen Geschichtswissenschaften geschieht durch staatliche Wissenschaftsförderung, Stiftungen, Unternehmen, die Regierung, große Forschungsuniversitäten, sowie deren private Geldgeber. Forschungs- und Organisationsformen beinhalten Querschnittdepartments von Universitäten, individuelle Forschende, Forschungsinstitute, DH-Zentren sowie DH-Labs. Die Nordamerikanische Forschung in diesem Bereich punktet also mit hoher Diversität in Finanzierung und Formaten. Um eine digitale Zukunft auch in der historischen Forschung sicherzustellen, ist es wichtig Veränderungen und neue Herausforderungen durch neue Arbeitsformen zu reflektieren.

Weiterlesen