CLARIN-D Blog

CLARIN-D Newsflash Oktober 2019

Neue Ressourcen

Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im DTA/CLARIN-D-Repositorium (BBAW, Berlin). Im Rahmen eines zweijährigen, von der DFG geförderten Kooperationsprojekts der Staats- und Universitätsbibliothek (SuUB) Bremen, der Universitätsbibliothek Johann Christian Senckenberg in Frankfurt/Main und der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) wurde eine umfassende digitale Sammlung zum Deutschen Kolonialismus erarbeitet. Das mehr als 1000 Titel mit ca. 240000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) besteht aus Publikationen, die in der Zeit des deutschen Kaiserreichs und von den genannten Bibliotheken unter dem Aspekt Kolonialismus gesammelt wurden.

Mit der Veröffentlichung des Korpus werden nun der Kolonialismusforschung, der Koloniallinguistik sowie weiteren historisch-textbasiert arbeitenden Disziplinen – und nicht zuletzt auch der breiteren Öffentlichkeit – eine in dieser Form einzigartige Sammlung an Publikationen in Bild und Text digital zur Verfügung gestellt. Die digitale Erfassung erfolgte automatisch mit Methoden der Optical Character Recognition (OCR). Die Texte wurden zunächst innerhalb der Qualitätssicherungsumgebung des Deutschen Textarchivs, DTAQ, publiziert, wo die Bände nach freier Anmeldung zugänglich und bereits vollumfänglich nutzbar sind (URL: http://www.deutschestextarchiv.de/dtaq/book?q=dsdk)

Neue Services

Das Bayerische Archiv für Sprachsignale hat eine neue Version seines Webservices API freigeben (2.31).

Weiterlesen

CLARIN-D Newsflash Juli 2019

Neue Ressourcen

GermaNet Logo

GermaNet Version 14.0 ist nun veröffentlicht. Neu bei dieser Version sind

  • Neue Synsets und ca. 10 000 neue lexikalische Einheiten für alle Wortklassen
  • Neue Relationen zwischen Synsets

Seit November 2017 wird der Briefwechsel Daniel Sanders' im Deutschen Textarchiv veröffentlicht. Derzeit stehen 182 Briefe im Volltext bereit. Insgesamt konnten 432 Briefe aus 41 Archiven nachgewiesen und verzeichnet werden. Mehr dazu im Blogpost zum Briefwechsel Daniel Sanders'.

Die Digitalisierung des zweiten Teils des Mannheimer Korpus Historischer Zeitungen und Zeitschriften (MKHZ2) wurde abgeschlossen. Dieses Digitalisierungsprojekt wurde in Kooperation der CLARIN-Zentren in Mannheim und Berlin durchgeführt. Die Ressourcen sind nun im Deutschen Textarchiv verfügbar. Weitere Informationen im Blogpost "Presseschau um die Jahrhundertwende".

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet (WebServices 2.30): 'AnnotConv' ist ein Service, welcher Annotationsdateien mit alignierter Zeitinformation in andere Formate konvertiert. Der zweite Service 'AudioEnhance' erlaubt die Anwendung von verschiedenen Signalverarbeitungen auf Sprachsignale des Benutzer, z.B. Filterung, Kanalselektierung und -zusammenfassung, Rauschreduktion, Tonhöhen- und Längenmanipulation. URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

Weiterlesen

CLARIN-D Newsflash Mai 2019

Mehr Informationen zu den Visualisierungen befinden sich hier: https://dhd2019.org/erkl%C3%A4rung-visualisierung/

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet: 'Subtitle' ist ein frei verfügbarer Service, welcher automatisch Untertitel-Tracks für Videos erzeugt - in einer Pipeline zusammen mit automatischer Spracherkennung sogar ohne Transkript. 'Anonymizer' ist ein Service welcher Sprachsignale und zugehörige Annotationen anhand einer Lis te von Stichwörtern automatisch anonymisiert, d.h. alle Vorkommnisse eines Stichworts werden im Signal durch ein Rauschen maskiert und in allen Annotationen gelöscht bzw. durch ein definiertes Tag ersetzt . URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

CLARIN-D und DARIAH-DE bei DHd 2019 in Mainz und Frankfurt

Auf der DHd gab es einen gemeinsamen Infostand von CLARIN-D und DARIAH-DE.

CLARIN-D hat zusammen mit dem DHd Verband und DARIAH insgesamt neun Stipendien für NachwuchswissenschaftlerInnen vergeben. Die Erfahrungsberichte wurden im CLARIN-D Blog veröffentlicht.

DHd-Workshop zu "Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten", organisiert von Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner am 25./26.03.2019 in Mainz mit dem Vortrag "Vergleich der Transkription mit und ohne Spracherkennung."

Workshops und Schulungen

Vorstellung von CLARIN-D Werkzeugen und Services und Beratung für Projekte/Antragstellungen in Gießen (Zentrum für Medien und Interaktivität (ZMI)), Berlin (ZfL Berlin: Leibniz-Zentrum für Literatur- und Kulturforschung Berlin) und Braunschweig (Georg-Eckert-Institut – Leibniz-Institut für internationale Schulbuchforschung) (FAG 8: Geschichtswissenschaften)

"BAS Tutorial Tools and Services" auf der Jahrestagung der Italienischen Gesellschaft der Stimmwissenschaften (AISV) am 14.02.2019 in Arezzo

CLARIN-D Newsflash Oktober 2018

Linguistic Annotation in XML (DTABf)
Linguistic Annotation in XML (DTABf)

 

 

Neue Standards

Doktorandentage

Workshops und Panels

Weiterlesen

CLARIN-D Newsflash Juli 2018

 

Titelseite der ersten Ausgabe der Philosophical Transactions
Titelseite der ersten Ausgabe der Philosophical Transactions

Neue Ressourcen in CLARIN-D

Neue Medien

Sommerschulen und Workshops

Veröffentlichungen

  • Im Sammelband "Computational Social Science—Die Analyse von Big Data" (herausgegeben von Prof. Dr. Andreas Blätte, Prof. Dr. Joachim Behnke, Prof. Dr. Kai-Uwe Schnapp, Prof. Dr. Claudius Wagemann) ist ein Methodenartikel erschienen, in dem die Analyse komplexer sozialwissenschaftlicher Konzepte mit korpusanalytischen Methoden reflektiert wird.
Weiterlesen