1 / 18

Von einer Datensammlung zum Korpus die Datenlage der Schreibwerkstatt Mehrsprachigkeit

Von einer Datensammlung zum Korpus die Datenlage der Schreibwerkstatt Mehrsprachigkeit. Melanie Andresen und Dagmar Knorr. Überblick. Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer Suchanfrage Auf dem Weg zu einem Korpus.

Télécharger la présentation

Von einer Datensammlung zum Korpus die Datenlage der Schreibwerkstatt Mehrsprachigkeit

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Von einer Datensammlung zum Korpus die Datenlage derSchreibwerkstatt Mehrsprachigkeit Melanie Andresen und Dagmar Knorr

  2. Überblick Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer Suchanfrage Auf dem Weg zu einem Korpus

  3. Peer Tutoren Schreibberatung Aufgabe der Peer Tutoren Schreibberatung = durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen

  4. Datensammlung – Überblick

  5. Beispiel – Datensatz Metadaten

  6. Beispiel – Datensatz Beratungsprotokoll

  7. Beispiel – Datenablage

  8. Suchanfrage stellen Suche Texte von Studierenden – mit Migrationshintergrund – angestrebter Abschluss: LA

  9. Suchanfrage stellen Suche Texte von Studierenden – mit Migrationshintergrund – angestrebter Abschluss: LA – Leserführung

  10. Dokumentauswahl als Ergebnis

  11. Frage Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen? Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?

  12. + allgemeine Kommentare direkt im Text Aufbereiten der Texte

  13. Mögliche Fragestellungen qualitative Fragen An welchen Stellen werden Textkommentare angebracht? Wie entwickeln sich Texte durch Kommentierungen? quantitative Fragen Vorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen

  14. Annotation • (halb)automatische Annotation (Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?) • manuelle Annotation • Mikroebene (z. B. Kontaminationen/Verschränkungen) • Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration) • Makroebene (z. B. Textstruktur)

  15. Veröffentlichung des Korpus • Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden? • Welche der Daten sollen veröffentlicht werden? • Wo kann das Korpus veröffentlicht werden?

  16. Fragen und Antworten?

More Related