LT for DH: Language Technology Resources and Tools for Digital Humanities

Workshop bei der COLING 2016

Mehr und mehr werden Sprachressourcen nicht nur in der Sprachtechnologie (Language Technology, LT) sondern auch in anderen Bereichen, etwa in den Digital Humanities oder auch Digitalen Geisteswissenschaften verwendet. Wenn die Werkzeuge aus der Sprachtechnologie in diesen Bereichen eingesetzt werden, entstehen neue Blickwinkel auf diese Ressourcen, z.B. hinsichtlich der Anpassung auf eine Fragestellung, Interoperabilität, technischer Anforderungen, Dokumentation und Benutzerfreundlichkeit der Zugänge. Bei diesem Workshop geht es um sprachtechnologische Werkzeuge und Daten, die in den Digital Humanities eingesetzt werden, mit Beispielanwendungen und einer Reihe von Fragestellungen, in denen die Sprachtechnologie eingesetzt werden kann.

Sprachtechnologische Anwendungen werden häufig trainiert und auf bestimmte Texttypen angepasst, manchmal auch auf bestimmte Formate, in denen Korpora vorliegen. Wenn diese Werkzeuge in anderen Zusammenhängen und auf andere Daten angewendet werden, mag es offensichtlich erscheinen, dass die Ergebnisse nicht den gleichen hohen Ansprüchen genügen kann, die Ergebnisse können aber trotzdem einen Erkenntnisgewinn darstellen, z.B. wenn historische Daten bearbeitet werden oder andere Texttypen und 'Genres'. Wenn man diese Werkzeuge etwa in den Geisteswissenschaften einsetzen möchte, werden auch weitere Anforderungen an Daten gestellt, z.B. weil weitere Annotatonen in den Daten vorliegen. Zusätzlich können Datenkonvertierungen notwendig sein , insbesondere dann, wenn Annotationswerkzeuge und Anfragewerkzeuge zusammen verwendet werden sollen oder Daten analysiert und visualisiert werden. 

Werkzeuge aus der Sprachtechnologie werden häufig miteinander verkettet und in festen Abläufen angewendet, die Konfiguration hängt dabei häufig von der sprachtechnologischen Anwendung ab. Das gilt auch für Abläufe in der DH-Forschung. Da sich aber DH-Werkzeuge stark von denen in der Sprachtechnologie unterscheiden, müssen neue Konfigurationen verwendet werden, was auch zu weiteren Interoperabilitätsanforderungen für Werkzuege führen kann.  Daneben sind die technischen Anfroderungen einiger sprachtechnologischer Werkzeuge teilweise so hoch und die Lernkurve so steil, dass sie für Nutzende aus den DH, die nicht auf diese Werkzeuge spezialisiert sind, eine hohe Hürde darstellen. Das bedeutet unter anderem, dass das Herunterladen von Software samt komplexer lokaler Installation vermieden werden sollte und die Programme stattdessen Web-basiert sein sollten. Außerdem sollten Nutzerstudien für Werkzeuge aus der Sprachtechnologie im Kontext der DH durchgeführt werden, um Rückmeldungen darüber zu erhalten, welche Anpassungen der Werkzeuge, Algorithmen und Zusatzfunktionen notwendig sind.  

Dieser Workshop wird sich mit allen diesen Bereichen beschäftigen. Konferenzsprache ist Englisch.

Weitere Informationen

Archiv

LT4DH

LT for DH: Language Technology Resources and Tools for Digital Humanities Workshop bei der COLING 2016

Zur Übersichtsseite »

Kick-Off-2020

Die Kick-Off-Veranstaltung der Auf- und Ausbauphase von CLARIN-D fand am Donnerstag, 03.11.2016 und am Freitag, 04.11.2016 am Mediencampus in Leipzig statt.

Zur Übersichtsseite »

Forum CA3 2016

Mit dem Forum CA3 2016 stellte die Forschungsinfrastruktur CLARIN-D ihre Angebote zum Auffinden, Auswerten und Aufbewahren von Sprachressourcen für die Forschung und Lehre in den Geistes- und Sozialwissenschaften vor.

Zur Übersichtsseite »

Newsletter

Die zwischen 2011 und 2015 entstandenen Newsletter sind ab jetzt im Archiv zu finden.

Zur Übersichtsseite »