Computerlinguistisch unterstütze Inhaltsanalyse biographischer Daten

Unsere Webanwendung „Textuelle Emigrationsanalyse“ ist ein erstes Beispiel dafür, wie Fakten über Emigrationen exploriert werden können, die durch Computerlinguistische Verarbeitung mittels CLARIN Infrastruktur aus grossen Textkorpora extrahiert wurden. Ein wichtiger Aspekt ist, dass die Ergebnisse aus verschiedenen Sichten betrachtet werden können (tabellarisch aggregiert, geographisch auf einer Karte, personenzentriert) und trotzdem der Bezug zur Originaltextstelle erhalten bleibt. Dadurch kann der Anwender jederzeit die Güte einzelner Fakten beurteilen und aktiv Verbesserungsvorschläge melden.

Besonders interessant für

  • Historiker
  • Politikwissenschaftler
  • Literaturwissenschaftler

Ausgangslage:

deutschsprachige Texte, die Migrationsinformationen enthalten, etwa Artikel, in denen erwähnt wird, dass jemand in ein anderes Land umgezogen ist.

Ziel:

Darstellung der Migrationsströme von und in ein Land.

Lösung:

Web Interface Computerlinguistisch unterstütze Inhaltsanalyse biographischer Daten (textuelle Migrationsanlyse) .

Verwandte CLARIN-D-Werkzeuge und -Dienste

Eine kurze Anleitung zu Computerlinguistisch unterstütze Inhaltsanalyse biographischer Daten "Textuelle Emigrationsanalyse"

  1. Gehen Sie auf diese Webseite:
    • Selektionsanzeige: Zufallsprinzip, Basis, UN-Daten
    • Mausklick auf ein Land: wählt das Land aus
    • Emigrationspfade werden durch Pfeile angezeigt
    • Tabelle zeigt aggregierte Informationen zum selektierten Land, die Emigration in blau, Immigration in rot
  2. Auswahl weiterer Quellen:
    • Links oben im Menü:
      • Wahl: German Wikipedia Edition (02/2011)
        • Daten beziehen sich auf die automatische Extraktion aus Wikipedia in der deutschen Ausgabe, Stand Februar 2011
        • Zusätzliche Spalte der Tabelle: „Details“ erlaubt eine Untersuchung aller erkannten Textstellen
        • Fehler können über das System gemeldet werden, die Meldungen fließen in neue Versionen des Werkzeugs ein
        • Der Link führt zum Wikipedia-Artikel in der aktuellen Fassung
      • Wahl: ÖBL (biographisches Lexikon)
        • Quellartikel über „Details“ in der Tabelle zugänglich
        • Fehler können über das System gemeldet werden, die Meldungen fließen in neue Versionen des Werkzeugs ein
      • Wahl Frech Wikipedia-Edition (02/2011)
        • Daten beziehen sich auf die automatische Extraktion aus Wikipedia in der französischen Ausgabe, Stand Februar 2011
        • Zusätzliche Spalte der Tabelle: „Details“ erlaubt eine Untersuchung aller erkannten Textstellen
        • Fehler können über das System gemeldet werden, die Meldungen fließen in neue Versionen des Werkzeugs ein
        • Der Link führt zum Wikipediaartikel in der aktuellen Fassung
  3. Export der Ergebnisse
    • Klicken Sie auf „export“ neben der Tabellenüberschrift
    • der Tabelleninhalt kann heruntergeladen werden
  4. Migrationsanalyse auf eigenen Daten:
    • Klicken Sie im Menü „Text Input“
    • Geben Sie eigenen Text ein, z.B. über Copy&Paste
    • Migrationsmuster werden basierend auf diesen Daten angezeigt

Weiterführende Informationen

Eine technisch-methodische Beschreibung findet sich in:

  • Blessing, Andre; Kuhn, Jonas (2014): Textual Emigration Analysis (TEA) In Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14) European Language Resources Association (ELRA), Reykjavik, Iceland.

Die Webanwendung erlaubt die Visualisierung und Exploration von Emigrationsverläufen. Dabei können unterschiedliche Datenquellen einbezogen werden. In der aktuellen Version werden folgende Quellen unterstützt:

  • Migrationsdatensatz der Vereinten Nationen (UN-Datensatz)
  • Extraktionsergebnisse aus dem textuellen Teil der deutschen Wikipedia Edition
  • Extraktionsergebnisse aus dem textuellen Teil des ÖBL (Österreichisches Biographisches Lexikon 1815-1950)
  • Extraktionsergebnisse aus dem textuellen Teil der französischen Wikipedia Edition

Die Anwendung bietet zusätzlich die Möglichkeit, aus eigenen Texten Emigrationsrelationen zu extrahieren.

  • Umgang mit der Benutzerschnittstelle
  • geobasierte Exploration des UN-Migrationsdatensatzes
  • geobasierte Exploration des Wikipedia-Migrationsdatensatzes
    • qualitative und quantitative Analyse durch Tabellen und verlinkte Textstellen
  • geobasierte Exploration des ÖBL-Migrationsdatensatzes
    • qualitative und quantitative Analyse durch Tabellen und verlinkten Textstellen
    • Meldung eines Annotationsfehlers
  • geobasierte Exploration des französischen Wikipedia-Migrationsdatensatzes
    • qualitative und quantitative Analyse durch Tabellen und verlinkten Textstellen
  • Export aller Emigrationsinstanzen eines Landes in eine csv-Datei
  • automatische Extraktion von Emigrationsmustern aus eigenen Texten
 

Tutorial - Video