CLARIN-D Blog

CLARIN-D Newsflash Juli 2020

CLARIN-D Newsflash Juli 2020

Tour de CLARIN: CLARIN-D im Porträt von April-Mai 2020

Von April bis Mai 2020 war das deutsche CLARIN Konsortium Gastgeber der Tour de CLARIN. Die Tour de CLARIN ist ein etabliertes CLARIN Format, das die europäischen CLARIN Konsortien in den Blick nimmt und deren Schwerpunkte und Ergebnisse vorstellt. Die CLARIN Länder werden in Blogposts und nach den Themenblöcken „Introduction“ (Überblick), „Tool“, „Resource“, „Event“ und „Interview“ einheitlich porträtiert.

CLARIN-D wurde in den folgenden fünf englischsprachigen Blogposts präsentiert:

Wir bedanken uns ganz herzlich bei allen Beitragenden und Interviewten!

Neue Ressourcen

Das CLARIN-Zentrum an der Universität des Saarlandes hat eine neue Version des Royal Society Corpus veröffentlicht. Die neue Version enhält zusätzlich Texte aus 50 weiteren Jahren.

Das CLARIN-Zentrum an der Universität Tübingen hat GermaNet 15.0 veröffentlicht.

Seit diesem Sommer ist eine neue Version des Index Thomisticus Treebank (ITTB) in Tündra und über das Tübinger Archive of Language Resources verfügbar.

Das Deutsche Textarchiv (DTA) hat die Nutzungsbedingungen für DTA-Korpora gelockert, für wesentliche Teile des DTA entfällt jetzt die "Non-Commercial"-Einschränkung.

Neue Lexika und Wörterbücher in DTA und DTAQ: Im Rahmen der Kuration historischer Wörterbücher und Lexika zur Integration in die CLARIN-D-Infrastruktur wurden an der BBAW drei neue Lexika

Weiterlesen

Alexander von Humboldts berühmte „Kosmos-Vorlesung“ an der Berliner Sing-Akademie (1827/28): von der digitalen zur Druckausgabe

Ein Blogbeitrag von Christian Thomas (CLARIN-D, BBAW)

Buch: Alexander von Humboldt, Henriette Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie. Hrsg. von Christian Kassung und Christian Thomas. Berlin: Insel Verlag, 2019. (insel taschenbuch 4719, ISBN 978-3-458-36419-1) Verlagsseite: https://www.suhrkamp.de/buecher/die_kosmos-vortraege-alexander_von_humboldt_36419.html.

Weiterlesen

CLARIN-D Newsflash Januar 2020

Buchveröffentlichung des Deutschen Textarchivs

2019, zum Jubiläum, seines 250. Geburtstages, ist im Suhrkamp/Insel Verlag eine Nachschrift der ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. Mit diesem Manuskript der Henriette Kohlrausch, deren bislang unbekannte Verfasserschaft in diesem Band belegt und erstmals einer breiten Öffentlichkeit bekannt gemacht wurde, liegt somit die einzige bekannte Nachschrift der populären Vorträge in der Berliner Sing-Akademie in einer zuverlässigen, anhand der Handschrift geprüften Textfassung vor. Diese basiert auf der gemäß TEI-XML im DTA-Basisformat für Manuskripte (DTABf-M) annotierten Textgrundlage, die 2014/15 im »Hidden Kosmos«-Projekt erstellt und im Deutschen Textarchiv publiziert wurde.

Neue Ressourcen

Das Saarbrücker Kochbuch-Corpus (SaCoCo) kann jetzt unter einer freien Lizenz heruntergeladen werden.

Neue Services

Weiterlesen

Die Zeichen der Zeit – sind digital

Ein Bericht von Anja Maria Hamann und Kai Richarz über das Seminar zur digitalen Edition von Briefen und Manuskripten von Daniel Sanders, im Sommersemester 2018 an der Humboldt-Universität zu Berlin

Eine gegenwärtige Herausforderung für geisteswissenschaftliche Disziplinen ist das Arbeiten in einer digitalen Welt. Dabei müssen sie dem Anstieg digitaler Quellen – ob durch Retrodigitalisierung oder die zunehmende Zahl an ‚digital born‘-Quellen – mit adäquaten Methoden, Strukturen und Werkzeugen begegnen. Vor dem Hintergrund dieser Herausforderung versucht das aufstrebende Forschungsfeld der Digital Humanities jene Brücke zwischen der alten, analogen Wissenschaft und der neuen, digitalen Welt zu schlagen: Einerseits, indem sie Sammlungen von Literatur und Quellen digital erschließt und für die Anwendung geisteswissenschaftlicher Arbeitsmethoden Verfahren zugänglich macht; andererseits, indem sie eine intelligente Vernetzung von Inhalten innerhalb einer zunehmend digitalen Wissenschaftskultur ermöglicht.1

Weiterlesen

Konstruktionsgrammatik - Sprachgebrauchsbasierte Analysen mit den Korpora des DWDS und des DTA

https://youtu.be/wgmzrT9UJxQ

Prof. Dr. Alexander Lasch, Linguist an der TU Dresden, zeigt in diesem Video, wie mit den Ressourcen des DTA und des DWDS sprachgebrauchsbasierte Analysen durchgeführt werden können, um das Deutsche konstruktionsgrammatisch zu beschreiben. Dafür stellt er zwei Leitfragen auf: 

  1. Kann mittels eines konstruktionsgrammatischen Ansatzes Sprachgebrauch gegenstandsadäquat beschrieben werden?
  2. Inwieweit können maschinelle Analysen des Sprachgebrauchs dazu dienen, den sprachgebrauchsbasierten konstruktionsgrammatischen Ansatz zu plausibilisieren?  

Ein sprachgebrauchsbasierter Zugang verlangt die Diskussion darüber, was für uns ein Muster, Pattern, Schema oder eine Konstruktion sei, wovon sowohl die Grammatik des Deutschen, als auch die Konstruktionsgrammatik als Teilgebiet unter spezifischen kognitionslinguistischen Prämissen profitieren können. Der aktuelle Trend ist die Ermittlung solcher Muster durch maschinelle Analysen. Diese Muster werden dann im nächsten Schritt abstrahiert, um aus ihnen Konstruktionen zu gewinnen. Durch diese Vorgehensweise soll Sprachwissen, welches Sprechende zur Produktion der sprachlichen Strukturen verwenden, aus Sprachgebrauch rekonstruiert werden. Für diese Arbeit bieten das DWDS und das DTA gute Mittel.

Weiterlesen

Bericht von der ESU 2017  Workshop: From Print and Manuscript to Electronic Version

Das CLARIN-Zentrum an der Berlin-Brandenburgische Akademie der Wissenschaften ist bereits seit einigen Jahren ein aktiver Teil der Community rund um die European Summer University in Digital Humanities „Culture and Technology“ (ESU) in Leipzig. Auch in diesem Jahr waren wir mit einem Kurs zur Digitalisierung und Annotation historischer Drucke und Manuskripte wieder vor Ort und haben am regen interdisziplinären Wissensaustausch zwischen allen Beteiligten teilgenommen. 

Weiterlesen

Wortartentagging für die lexikographische Recherche

Wortartentagging für die lexikographische Recherche

Moderne Lexikographie ist heute in der Regel korpusbasiert. Die meisten uns bekannten größeren lexikographischen Vorhaben nutzen meist sehr große Textkorpora als Grundlage der lexikographischen Beschreibung ihrer Stichwörter. Anders ausgedrückt: die Benutzer von Wörterbüchern erwarten zu Recht, verlässliche und geprüfte Informationen vorzufinden. Eine Vorverarbeitung der Korpora - das Wortartentagging - ist in diesem Prozess unbedingt erforderlich.

Weiterlesen