CLARIN-D Blog

CLARIN-D Newsflash Juli 2020

CLARIN-D Newsflash Juli 2020

Tour de CLARIN: CLARIN-D im Porträt von April-Mai 2020

Von April bis Mai 2020 war das deutsche CLARIN Konsortium Gastgeber der Tour de CLARIN. Die Tour de CLARIN ist ein etabliertes CLARIN Format, das die europäischen CLARIN Konsortien in den Blick nimmt und deren Schwerpunkte und Ergebnisse vorstellt. Die CLARIN Länder werden in Blogposts und nach den Themenblöcken „Introduction“ (Überblick), „Tool“, „Resource“, „Event“ und „Interview“ einheitlich porträtiert.

CLARIN-D wurde in den folgenden fünf englischsprachigen Blogposts präsentiert:

Wir bedanken uns ganz herzlich bei allen Beitragenden und Interviewten!

Neue Ressourcen

Das CLARIN-Zentrum an der Universität des Saarlandes hat eine neue Version des Royal Society Corpus veröffentlicht. Die neue Version enhält zusätzlich Texte aus 50 weiteren Jahren.

Das CLARIN-Zentrum an der Universität Tübingen hat GermaNet 15.0 veröffentlicht.

Seit diesem Sommer ist eine neue Version des Index Thomisticus Treebank (ITTB) in Tündra und über das Tübinger Archive of Language Resources verfügbar.

Das Deutsche Textarchiv (DTA) hat die Nutzungsbedingungen für DTA-Korpora gelockert, für wesentliche Teile des DTA entfällt jetzt die "Non-Commercial"-Einschränkung.

Neue Lexika und Wörterbücher in DTA und DTAQ: Im Rahmen der Kuration historischer Wörterbücher und Lexika zur Integration in die CLARIN-D-Infrastruktur wurden an der BBAW drei neue Lexika

Weiterlesen

CLARIN-D Newsflash Januar 2020

Buchveröffentlichung des Deutschen Textarchivs

2019, zum Jubiläum, seines 250. Geburtstages, ist im Suhrkamp/Insel Verlag eine Nachschrift der ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. Mit diesem Manuskript der Henriette Kohlrausch, deren bislang unbekannte Verfasserschaft in diesem Band belegt und erstmals einer breiten Öffentlichkeit bekannt gemacht wurde, liegt somit die einzige bekannte Nachschrift der populären Vorträge in der Berliner Sing-Akademie in einer zuverlässigen, anhand der Handschrift geprüften Textfassung vor. Diese basiert auf der gemäß TEI-XML im DTA-Basisformat für Manuskripte (DTABf-M) annotierten Textgrundlage, die 2014/15 im »Hidden Kosmos«-Projekt erstellt und im Deutschen Textarchiv publiziert wurde.

Neue Ressourcen

Das Saarbrücker Kochbuch-Corpus (SaCoCo) kann jetzt unter einer freien Lizenz heruntergeladen werden.

Neue Services

Weiterlesen

CLARIN-D Newsflash Juli 2019

Neue Ressourcen

GermaNet Logo

GermaNet Version 14.0 ist nun veröffentlicht. Neu bei dieser Version sind

  • Neue Synsets und ca. 10 000 neue lexikalische Einheiten für alle Wortklassen
  • Neue Relationen zwischen Synsets

Seit November 2017 wird der Briefwechsel Daniel Sanders' im Deutschen Textarchiv veröffentlicht. Derzeit stehen 182 Briefe im Volltext bereit. Insgesamt konnten 432 Briefe aus 41 Archiven nachgewiesen und verzeichnet werden. Mehr dazu im Blogpost zum Briefwechsel Daniel Sanders'.

Die Digitalisierung des zweiten Teils des Mannheimer Korpus Historischer Zeitungen und Zeitschriften (MKHZ2) wurde abgeschlossen. Dieses Digitalisierungsprojekt wurde in Kooperation der CLARIN-Zentren in Mannheim und Berlin durchgeführt. Die Ressourcen sind nun im Deutschen Textarchiv verfügbar. Weitere Informationen im Blogpost "Presseschau um die Jahrhundertwende".

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet (WebServices 2.30): 'AnnotConv' ist ein Service, welcher Annotationsdateien mit alignierter Zeitinformation in andere Formate konvertiert. Der zweite Service 'AudioEnhance' erlaubt die Anwendung von verschiedenen Signalverarbeitungen auf Sprachsignale des Benutzer, z.B. Filterung, Kanalselektierung und -zusammenfassung, Rauschreduktion, Tonhöhen- und Längenmanipulation. URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

Weiterlesen

Web-MAUS Evaluation und Dokumentation eines Integrationsprozesses anhand des ICE-Scotland Corpus - Simon Betz - Forum CA3

https://youtu.be/J-EjQU5JnKg

Simon Betz von der Universität Bielefeld stellt stellvertretend für die  F-AG 6 "Gesprochene Sprache und andere Modalitäten" das CLARIN Kurationsprojekt 3 vor. Hierbei handelt es sich um eine WebMAUS Evaluation anhand des ICE-Scotland Corpus. 

Die generellen Ziele des Kurationsprojektes waren 

  • Best Practice Guidelines für phonetische Anreicherung von Korpusdaten zu entwickeln und definieren
  • Zur Verbesserung von WebMAUS beitragende Tests und Vorschläge zu liefern, um systematische Fehler zu beheben
  • Ein reich annotiertes Sprachkorpus, welches Teil des International Corpus of English: Scotland ist, bereitzustellen
Weiterlesen