Auffinden in CLARIN-D - Dr. Alexander Geyken - Forum CA3

https://youtu.be/HCXjWryIxZY

Dr. Alexander Geyken von der Berlin Brandenburgischen Akademie der Wissenschaften spricht auf dem Forum CA3 2016 in Hamburg über die Aufgabe des Auffindens innerhalb unserer Forschungsinfrastruktur. Als Beispielressource verwendet er hierfür historische Texte. 

Für die Datensuche gibt es über CLARIN-D drei Möglichkeiten:

  • Metadatensuche mittels des Virtual Language Observatorys (VLO)
    Das VLO ermöglicht innerhalb aller CLARIN Ressourcen zu suchen. Die Suche kann hierbei präzisiert werden, indem direkt nach speziellen Sprachen, Kollektionen, Ressourcentypen, Modalitäten, Genre und mehr gesucht wird
  • Volltextsuche sowie
  • über die CLARIN Zentren 

Je nachdem welche Art Texte gesucht werden soll, stehen unterschiedliche Ressourcen zu Verfügung. Für historische Texte aus dem 17., 18. und 19. Jahrhundert beispielsweise sind es Texte aus den Bereichen der Wissenschaft, Belletristik und Gebrauchsliteratur. Sie sind aus dem Deutschen Textarchiv, CLARIN Kooperationsprojekten, Texten von Forschenden sowie Texttauschvereinbarungen (das heißt Texte und Kollektionen die nachträglich an das CLARIN Format angepasst wurden) entnommen. Für Texte aus dem 19. Jahrhundert ist die Ressource das DDR-Presseportal, bestehend aus Texten der Zeitungen Neues Deutschland, Berliner Zeitung sowie Neue Zeit. Um eine reibungslose und einheitliche Suche in den Ressourcen zu gewährleisten, werden sämtliche Texte im CLARIN-eigenen DTA-Basisformat bereitgestellt. 

Geschrieben von : Sarah Schneider

Gravatar
Roberta Toscano
Recherche in CLARIN VLO
Es ist beeindruckend welche Möglichkeite n sich mit einer Recherche in CLARIN VLO ergeben. Diese Suchmaschine stellt nicht nur ein (inter)national es Vergleichinstru ment dar, sondern kann auch als Werkzeug für medien- und kulturwissensch afltiche Fragestellungen genutzt werden.
Erfreulich ist die Einbindung von Europeana Newspapers.
Es bleibt zu hoffen, dass sich für OCR eine nachhaltige Lösung finden lässt.

0

1000 Buchstaben übrig