CLARIN-D Blog

Auffinden in CLARIN-D - Dr. Alexander Geyken - Forum CA3

https://youtu.be/HCXjWryIxZY

Dr. Alexander Geyken von der Berlin Brandenburgischen Akademie der Wissenschaften spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Auffindens innerhalb unserer Forschungsinfrastruktur. Als Beispielressource verwendet er hierfür historische Texte. 

Für die Datensuche gibt es über CLARIN-D drei Möglichkeiten:

  • Metadatensuche mittels des Virtual Language Observatorys (VLO)
    Das VLO ermöglicht innerhalb aller CLARIN Ressourcen zu suchen. Die Suche kann hierbei präzisiert werden, indem direkt nach speziellen Sprachen, Kollektionen, Ressourcentypen, Modalitäten, Genre und mehr gesucht wird
  • Volltextsuche sowie
  • über die CLARIN Zentren 
Weiterlesen

Die Reform des Deutschen Urheberrechtsgesetzes 2017 – welche Konsequenzen hat sie für DH-Forschende?

Die Reform des Deutschen Urheberrechtsgesetzes 2017 – welche Konsequenzen hat sie für DH-Forschende?

Die Reform des Deutschen Urheberrechtsgesetzes 2017 – welche Konsequenzen hat sie für DH-Forschende?

Es ist allseits bekannt, dass Sprachdaten (und Sprachressourcen) oft urheberrechtlich oder vom sui-generis-Recht für Datenbanken geschützt sind. Deswegen ist ihre Erhebung, Nutzung und Verbreitung nur mit Zustimmung des Rechtsinhabers oder bei Eingreifen einer gesetzlichen Schrankenregelung zulässig. Die Zustimmung der jeweiligen Rechtsinhaber einzuholen, ist häufig sehr zeit- und kostenintensiv und mit großen Schwierigkeiten für Forscher verbunden. Deswegen führten in den letzten Jahren die meisten nationalen Gesetzgeber gesetzliche Schrankenregelungen speziell für Forschungszwecke ein

Weiterlesen

Aufbewahren in CLARIN-D - Dr. Thorsten Trippel - Forum CA3

https://youtu.be/Msqm1EFybM4

Dr. Thorsten Trippel von der Universität Tübingen, Liaison Koordinator des Projektverbunds CLARIN-D, spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Aufbewahrens von Daten innerhalb der Forschungsinfrastruktur CLARIN-D.

Gründe für Datenaufbewahrung sind

  1.  Sicherung der guten wissenschaftlichen Praxis
  2.  Nachnutzung von Forschungsdaten und
  3.  Attribution andersartiger wissenschaftlicher Leistung
Weiterlesen

Forum CA3 - CLARIN-D im Überblick

  https://youtu.be/5nuUYbQBNXM

Am 07. und 08.07.2016 fand in der Staats- und Universitätsbibliothek Hamburg das Forum CA3 statt. In Keynotepräsentationen, Überblicksvorträgen und einer Hands-on Session wurde der Einsatz digitaler Sprachressourcen in der Lehrerausbildung, historischen Forschung und im multilingualen europäischen Kontext veranschaulicht. Als wissenschaftlicher Koordinator des Projektverbundes CLARIN-D eröffnete Prof. Dr. Erhard Hinrichs von der Universität Tübingen die Vortragsreihe mit Informationen über Organisation und Aufgaben unserer Forschungsinfrastuktur.  

Weiterlesen

CLARIN Federated Content Search: Suche in verteilten Sprachressourcen

https://youtu.be/SaUJVdfz1CA

In diesem Screencast stellen wir unser Werkzeug CLARIN Federated Content Search (FCS) vor. Es ermöglicht eine Suche nach unterschiedlichen Verwendungen eines Wortes in verteilten Sprachressourcen. Hierfür kann ein beliebiger Begriff in die Suchmaske eingegeben werden. um ihn entweder Sprachunabhängig oder in einer bestimmten Sprache darzustellen. Auch die Art der Darstellung lässt sich manuell festlegen.  

Eine dieser Darstellungsformen, die auch in diesem Screencast gezeigt wird, ist KWIC - also Keyword in Context. Hierbei wird das Wort in verschiedenen möglichen Kontexten dargestellt. 

Weiterlesen

Wo sagt man ... ?

  https://youtu.be/gJo_eGbEQ0I

Besonders interessant für Dialektforschende und RegionalhistorikerInnen ist das in diesem Screencast vorgestellte Werkzeug "Wo sagt man?". Es ermöglicht Nutzenden nach Ausdrücken zu suchen und visualisiert die Bereiche auf einer Karte, in denen dieser Ausdruck verwendet wird, beziehungsweise wo er aufgenommen wurde und liefert weitere Informationen dazu. 

Weiterlesen

Die Dimensionen des Allgemeinen Persönlichkeitsrechts – insbesondere Urheberpersönlichkeitsrechte

Die Dimensionen des Allgemeinen Persönlichkeitsrechts – insbesondere Urheberpersönlichkeitsrechte

Jeder hat grundsätzlich das Recht auf freie Entfaltung seiner Persönlichkeit – dies statuiert seit 1949 Art. 2 Abs. 1 des Deutschen Grundgesetzes (GG). Umfasst ist nicht nur die Freiheit des Einzelnen, das zu tun und zu lassen, was er möchte und anderen nicht schadet[1](d.h. die allgemeine Handlungsfreiheit), sondern in Verbindung mit der Menschenwürdegarantie (Art. 1 Abs. 1 GG) auch ein umfassender Persönlichkeitsschutz in allen Beziehungen eines Menschen.[2] Diese Rechte sind auch beim Umgang mit Forschungsdaten zu beachten, die sowohl das allgemeine Persöhnlichkeitsrecht als auch das Urheberpersönlichkeitsrecht tangieren können. 

Weiterlesen

Rechtliche Fragen in Bezug auf einen Data Management Plan

Rechtliche Fragen in Bezug auf einen Data Management Plan

In den letzten Jahren war der „Data Management Plan“ in der Sprachressourcen-Community in aller Munde. Dies ist teilweise auch der Ausweitung des Open Research Data Pilots auf alle Bereiche des Horizon 2020 Programm zu verdanken. Demzufolge sind alle Forschungsdaten der von H2020-geförderten Projekte ab 2017 standardmäßig frei zugänglich („open“; ein Ausstieg ist aber immer noch möglich); Projekte müssen folglich einen Data Management Plan (DMP) ausarbeiten, der die Fragen der Auffindbarkeit (findability), des Zugangs (accessibility), der Interoperabilität (interoperability) und der Wiederverwendbarkeit (re-usability; gemeinsam: FAIR) der Daten beantwortet (vgl. Art 29.3 des H2020 Model Grant Agreement: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf). Eine Mustervorlage für einen DMP ist auf der Website des Europäischen Kommission abrufbar (http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf).

Weiterlesen

Automatische Annotation von Namen

https://youtu.be/OtDTtpMnzdk

Bücher, Artikel und Manuskripte enthalten oft Angaben zu Personen, Orten und Organisationen. Um sich einen Überblick über diese Angaben zu verschaffen ist ein automatisches Werkzeug wie ein Named-Entity-Recognizer sinnvoll, mit dessen Hilfe Namen markiert und kategorisiert werden können. Gerade bei längeren Texten erhält man dadurch einen guten Überblick, häufig sieht man sogar Namen, Orte und Einrichtungen, die man beim Lesen übersehen hätte.

Mit Hilfe des Tools WebLicht, welches einen Named Entity Recognizer für mehrere Sprachen enthält, können diese Informationen automatisch markiert und extrahiert werden. Sie müssen sich lediglich mit Ihrem CLARIN-Account oder dem Zugang Ihrer Heimatinstitution einloggen und können dann Ihren Text eingeben, hochladen oder einen Beispieltext auswählen. Der nächste Schritt ist die Zusammenstellung Ihrer Prozesskette. Um dies tun zu können klicken Sie im nächsten Schritt auf "Advanced Mode".   

Weiterlesen

DiaCollo Screencast

https://youtu.be/_0HdBPoajZA

Dieser Screencast zeigt die Verwendung des Werkzeugs "DiaCollo: Kollokationsanalyse in diachroner Perspektive". 

Der Kontext eines Wortes, in diesem Fall seine Kollokationen, kann Aufschluss über Bedeutung des Wortes oder Bedeutungswandel geben. Ebenso können politische, kulturelle oder gesellschaftliche Veränderungen mittels der Kollokationen eines Wortes aufgefunden werden. 

Weiterlesen