CLARIN-D Blog

CLARIN Federated Content Search: Suche in verteilten Sprachressourcen

https://youtu.be/SaUJVdfz1CA

In diesem Screencast stellen wir unser Werkzeug CLARIN Federated Content Search (FCS) vor. Es ermöglicht eine Suche nach unterschiedlichen Verwendungen eines Wortes in verteilten Sprachressourcen. Hierfür kann ein beliebiger Begriff in die Suchmaske eingegeben werden. um ihn entweder Sprachunabhängig oder in einer bestimmten Sprache darzustellen. Auch die Art der Darstellung lässt sich manuell festlegen.  

Eine dieser Darstellungsformen, die auch in diesem Screencast gezeigt wird, ist KWIC - also Keyword in Context. Hierbei wird das Wort in verschiedenen möglichen Kontexten dargestellt. 

Weiterlesen

Wo sagt man ... ?

  https://youtu.be/gJo_eGbEQ0I

Besonders interessant für Dialektforschende und RegionalhistorikerInnen ist das in diesem Screencast vorgestellte Werkzeug "Wo sagt man?". Es ermöglicht Nutzenden nach Ausdrücken zu suchen und visualisiert die Bereiche auf einer Karte, in denen dieser Ausdruck verwendet wird, beziehungsweise wo er aufgenommen wurde und liefert weitere Informationen dazu. 

Weiterlesen

Die Dimensionen des Allgemeinen Persönlichkeitsrechts – insbesondere Urheberpersönlichkeitsrechte

Die Dimensionen des Allgemeinen Persönlichkeitsrechts – insbesondere Urheberpersönlichkeitsrechte

Jeder hat grundsätzlich das Recht auf freie Entfaltung seiner Persönlichkeit – dies statuiert seit 1949 Art. 2 Abs. 1 des Deutschen Grundgesetzes (GG). Umfasst ist nicht nur die Freiheit des Einzelnen, das zu tun und zu lassen, was er möchte und anderen nicht schadet[1](d.h. die allgemeine Handlungsfreiheit), sondern in Verbindung mit der Menschenwürdegarantie (Art. 1 Abs. 1 GG) auch ein umfassender Persönlichkeitsschutz in allen Beziehungen eines Menschen.[2] Diese Rechte sind auch beim Umgang mit Forschungsdaten zu beachten, die sowohl das allgemeine Persöhnlichkeitsrecht als auch das Urheberpersönlichkeitsrecht tangieren können. 

Weiterlesen

Rechtliche Fragen in Bezug auf einen Data Management Plan

Rechtliche Fragen in Bezug auf einen Data Management Plan

In den letzten Jahren war der „Data Management Plan“ in der Sprachressourcen-Community in aller Munde. Dies ist teilweise auch der Ausweitung des Open Research Data Pilots auf alle Bereiche des Horizon 2020 Programm zu verdanken. Demzufolge sind alle Forschungsdaten der von H2020-geförderten Projekte ab 2017 standardmäßig frei zugänglich („open“; ein Ausstieg ist aber immer noch möglich); Projekte müssen folglich einen Data Management Plan (DMP) ausarbeiten, der die Fragen der Auffindbarkeit (findability), des Zugangs (accessibility), der Interoperabilität (interoperability) und der Wiederverwendbarkeit (re-usability; gemeinsam: FAIR) der Daten beantwortet (vgl. Art 29.3 des H2020 Model Grant Agreement: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf). Eine Mustervorlage für einen DMP ist auf der Website des Europäischen Kommission abrufbar (http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf).

Weiterlesen

Automatische Annotation von Namen

https://youtu.be/OtDTtpMnzdk

Bücher, Artikel und Manuskripte enthalten oft Angaben zu Personen, Orten und Organisationen. Um sich einen Überblick über diese Angaben zu verschaffen ist ein automatisches Werkzeug wie ein Named-Entity-Recognizer sinnvoll, mit dessen Hilfe Namen markiert und kategorisiert werden können. Gerade bei längeren Texten erhält man dadurch einen guten Überblick, häufig sieht man sogar Namen, Orte und Einrichtungen, die man beim Lesen übersehen hätte.

Mit Hilfe des Tools WebLicht, welches einen Named Entity Recognizer für mehrere Sprachen enthält, können diese Informationen automatisch markiert und extrahiert werden. Sie müssen sich lediglich mit Ihrem CLARIN-Account oder dem Zugang Ihrer Heimatinstitution einloggen und können dann Ihren Text eingeben, hochladen oder einen Beispieltext auswählen. Der nächste Schritt ist die Zusammenstellung Ihrer Prozesskette. Um dies tun zu können klicken Sie im nächsten Schritt auf "Advanced Mode".   

Weiterlesen

DiaCollo Screencast

https://youtu.be/_0HdBPoajZA

Dieser Screencast zeigt die Verwendung des Werkzeugs "DiaCollo: Kollokationsanalyse in diachroner Perspektive". 

Der Kontext eines Wortes, in diesem Fall seine Kollokationen, kann Aufschluss über Bedeutung des Wortes oder Bedeutungswandel geben. Ebenso können politische, kulturelle oder gesellschaftliche Veränderungen mittels der Kollokationen eines Wortes aufgefunden werden. 

Weiterlesen

CLARIN-D Helpdesk

https://youtu.be/ETLM_351ZtM

Bei jeglichen Fragen zu unserer Forschungsinfrastruktur steht Ihnen das CLARIN-D Zentrum Hamburger Zentrum für Sprachkorpora (HZSK) mittels des Helpdesks zur Verfügung.

Der Helpdesk bietet so eine Schnittstelle zwischen CLARIN und Ihnen als UserIn, indem er Ihre Frage in einem zentralen Fragenpool aufnimmt und sie dann mittels eines Ticketing Systems an das entsprechende Expertenteam weiterleitet. Die Mitarbeitenden des Helpdesks haben es sich zum Ziel gesetzt Ihre Frage nach spätestens nach 48 Stunden weiter zu delegieren, um Ihnen schnellstmöglich behilflich sein zu können. 

Bericht von der ESU 2017  Workshop: From Print and Manuscript to Electronic Version

Das CLARIN-Zentrum an der Berlin-Brandenburgische Akademie der Wissenschaften ist bereits seit einigen Jahren ein aktiver Teil der Community rund um die European Summer University in Digital Humanities „Culture and Technology“ (ESU) in Leipzig. Auch in diesem Jahr waren wir mit einem Kurs zur Digitalisierung und Annotation historischer Drucke und Manuskripte wieder vor Ort und haben am regen interdisziplinären Wissensaustausch zwischen allen Beteiligten teilgenommen. 

Weiterlesen

Wortartentagging für die lexikographische Recherche

Wortartentagging für die lexikographische Recherche

Moderne Lexikographie ist heute in der Regel korpusbasiert. Die meisten uns bekannten größeren lexikographischen Vorhaben nutzen meist sehr große Textkorpora als Grundlage der lexikographischen Beschreibung ihrer Stichwörter. Anders ausgedrückt: die Benutzer von Wörterbüchern erwarten zu Recht, verlässliche und geprüfte Informationen vorzufinden. Eine Vorverarbeitung der Korpora - das Wortartentagging - ist in diesem Prozess unbedingt erforderlich.

Weiterlesen

Digital Humanities studieren und netzwerken mit CLARIN

Digital Humanities studieren und netzwerken mit CLARIN

Man nehme 70 internationale Nachwuchswissenschaftler aus den Digital Humanities (DH), 11 verschiedene Kurse von erfahrenen Experten, und einige Präsentationen von Forschenden zu ihrer Arbeit in verschiedenen DH-Bereichen. Man füge ein Rahmenprogramm hinzu, das Exkursionen zu Museen und Kulturstätten beinhaltet und voilà: Im Sommer 2017 war die „Europäische Sommeruniversität- Kulturen und Technologien“ (ESU) ein perfekter Treffpunkt für Forschende, um DH-Methoden zu erlernen und anzuwenden, ihren Horizont um verschiedene DH-Forschungsfragen zu erweitern und ein internationales Netzwerk an Expertise aufzubauen.

Weiterlesen