CLARIN-D Newsflash Oktober 2019

Neue Ressourcen

Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im DTA/CLARIN-D-Repositorium (BBAW, Berlin). Im Rahmen eines zweijährigen, von der DFG geförderten Kooperationsprojekts der Staats- und Universitätsbibliothek (SuUB) Bremen, der Universitätsbibliothek Johann Christian Senckenberg in Frankfurt/Main und der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) wurde eine umfassende digitale Sammlung zum Deutschen Kolonialismus erarbeitet. Das mehr als 1000 Titel mit ca. 240000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) besteht aus Publikationen, die in der Zeit des deutschen Kaiserreichs und von den genannten Bibliotheken unter dem Aspekt Kolonialismus gesammelt wurden.

Mit der Veröffentlichung des Korpus werden nun der Kolonialismusforschung, der Koloniallinguistik sowie weiteren historisch-textbasiert arbeitenden Disziplinen – und nicht zuletzt auch der breiteren Öffentlichkeit – eine in dieser Form einzigartige Sammlung an Publikationen in Bild und Text digital zur Verfügung gestellt. Die digitale Erfassung erfolgte automatisch mit Methoden der Optical Character Recognition (OCR). Die Texte wurden zunächst innerhalb der Qualitätssicherungsumgebung des Deutschen Textarchivs, DTAQ, publiziert, wo die Bände nach freier Anmeldung zugänglich und bereits vollumfänglich nutzbar sind (URL: http://www.deutschestextarchiv.de/dtaq/book?q=dsdk)

Neue Services

Das Bayerische Archiv für Sprachsignale hat eine neue Version seines Webservices API freigeben (2.31).

  • Der neue Service "AnnotConv" ist nun in Betrieb, er übersetzt signalbasierte Annotationsdateien in verschiedene Formate.
  • Neuer Service "AudioEnhance" zur Manipulation von Sprachsignalen: Kanalauswahl und -merging, Re-Sampling, Extraktion von Tonspuren aus Video-Eingaben, Amplituden-Normalisierung, Bandpass-Filterung, Rauschunterdrückung, Änderung der Sprechgeschwindigkeit ohne die Tonlage zu verändern, Änderung der Tonhöhe ohne die Sprechgeschwindigkeit zu ändern.

Vom Deutschen Textarchiv ins Language Resource Switchboard

Das Deutsche Textarchiv (DTA) an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) unterstützt seit neuestem die Übermittlung aller im DTA enthaltenen Werke an das innerhalb von CLARIN-PLUS entwickelte Language Resource Switchboard (LRS). Das LRS evaluiert die einzelnen Textdateien und bietet im Anschluss eine Auswahl an unterschiedlichen Werkzeugen an, mithilfe derer die Texte analysiert werden können.

Kurse, Tutorien

ESU Leipzig vom 23. Juli bis 2. August

Zum zehnten Mal in Folge fand die "Culture & Technology" European Summer University in Digital Humanities an der Universität Leipzig statt. Im Jubiläumsjahr nahmen daran 92 Studierende, zahlreiche NachwuchswissenschaftlerInnen, WissenschaftlerInnen und weitere Mitglieder von Universitäten aus dem In- und Ausland teil. Elisabeth Burr hat zusammen mit ihrem Team (u.a mit Marie Annisius und Ulrike Fußbahn) zum wiederholten Male eine erfolgreiche Summer School ausgerichtet. Beigetragen haben dazu auch wieder CLARIN-D Dozenten, die mit einem vielfältigen Kursangebot vertreten waren. Die TeilnehmerInnen konnten aus insgesamt elf Kursen wählen und davon vier CLARIN-D Angebote wahrnehmen: 

  • Andreas Witt (University of Mannheim & Leibniz Institut für Deutsche Sprache, Mannheim, Germany): Compilation, Annotation and Analysis of Written Text Corpora. Introduction to Methods and Tools http://esu.culintec.de/?q=/node/1107)
  • Bernhard Fisseni (Leibniz-Institut für Deutsche Sprache, Mannheim, Germany): Searching Linguistic Patterns in Text Corpora for Digital Humanities Research (http://esu.culintec.de/?q=/node/1111)
  • Christoph Draxler (University of Munich, Germany): All About Data – Exploratory Data Modelling and Practical Database Access (http://esu.culintec.de/?q=/node/1119)
  • Janos Borst / Felix Helfer (University of Leipzig, Germany): An Introduction to Neural Networks for Natural Language Processing - Applications and Implementation (http://esu.culintec.de/?q=/node/1115

 

Elisabeth Burr und 10 Jahre ESU in Leipzig: Das wird gefeiert! (Bild: Kristina Pahor de Maiti, Universität Ljubljana)

 

Informationen zur kommenden ESU 2020 finden Sie hier: http://esu.culintec.de/

Tagungen

CLARIN Annual Conference 2019 in Leipzig

https://www.clarin.eu/event/2019/clarin-annual-conference-2019-leipzig-germany 

Zur diesjährigen CLARIN Annual Conference (CAC) hat CLARIN ERIC nach Leipzig eingeladen. Das lokale Organisationsteam unter der Leitung von Gerhard Heyer hat in Zusammenarbeit mit der Universität Leipzig und dem Institut für Angewandte Informatik über 200 TeilnehmerInnen aus den verschiedenen CLARIN Konsortien begrüßt. Das diesjährige special topic lautete “Humanities and Social Science research enabled by language resources and technology” und hat im Besonderen Beiträge über geistes- und sozialwissenschaftliche Forschungsfragen adressiert, die digitale Sprachressourcen, -technologien oder -dienstleistungen aus CLARIN nutzen. Über zwanzig Mitglieder der deutschen Delegation waren vertreten und haben ihre Projekte, CLARIN-D Tools und Sprachressourcen sowohl in Vorträgen, Posterbeiträgen, als auch während des CLARIN Basars vorgestellt. Elke Teich (Zentrumsleitung Universität des Saarlandes) hat eine Keynote Lecture zum Thema "Corpus-Driven Investigation of Language Use, Variation and Change - Resources, Models, Tools" gehalten. In seiner Funktion als National Coordinator Deutschlands hat Erhard Hinrichs zudem einen Vortrag zum Thema "Presentation on CLARIN in Germany: on-going activities in CLARIN-D and joint activities in CLARIAH-DE" gehalten, in dem er auch über die aktuelle Kooperation zwischen CLARIN-D und DARIAH-DE in dem gemeinsamen Projekt CLARIAH-DE informiert hat.

Andere Tagungen

Hanna Hedeland, Heidemarie Sambale und Tommi Pirinen haben auf der GAL 2019 in Halle das Hamburger Zentrum für Sprachkorpora, eines der CLARIN-Zentren, vorgestellt. Es ging unter anderem um Forschungsdatenmanagement, den CLARIN Helpdesk und die Software EXMARaLDA. https://gal-tagung-2019.sprechwiss.uni-halle.de/files/2019/08/Book-of-Abstracts.pdf

Christoph Draxler (BAS München) hat auf der Tagung "Phonetik & Phonologie" in Düsseldorf am 25.9.2019 einen Workshop mit dem Titel “CLARIN-D Workshop zur gesprochenen Sprache” gegeben. https://blogs.phil.hhu.de/pundp2019/programm/

Auf der DH Tagung in Utrecht sowie dem Parthenos Workshop in Sofia hat Christoph Draxler vom BAS die Webdienste des BAS zur Transkription und Alignierung erfolgreich vorgestellt; auf der CLARIN Jahrestagung wurde das speziell für die Geschichtswissenschaften entwickelte Oral History Portal auf einem Poster und in Live-Demos prasentiert.

Projekte

Das BAS ist Partner im Projekt Sprechgeschwindigkeit und Reduktion im Deutschen der Germanistik der Uni Leipzig (https://home.uni-leipzig.de/siebenh/projekt/spurd/index.html). Hier hilft es beim Aufbau einer Datenbank für geographische und Sprecherdaten sowie ihre Verknüpfung mit Transkriptions- und Signaldaten.

Das BAS ist Projektpartner in DoReCo (Language Documentation Reference Corpora, http://doreco.info). Ziel des Projekts ist es, die technischen Parameter einer Vielzahl von Korpora bedrohter oder wenig dokumentierter Sprachen soweit zu vereinheitlichen, dass sie mit modernen Webdiensten wie WebMAUS bearbeitet werden und damit der Forschung als phonetisch transkribierte und zeitaligniert Sprachdatenbanken zugänglich gemacht werden können.

Personalien

Andreas Witt (IDS Mannheim) wurde zum Mitglied des CLARIN Board of Directors ernannt. Wir gratulieren recht herzlich!

Eine Ankündigung finden Sie auch auf der CLARIN Website unter https://www.clarin.eu/news/andreas-witt-joins-clarin-eric-board-directors

Geschrieben von : Jörg Knappen