FOLKER-Schulung am IDS Mannheim, 26.11.2021

am Freitag, den 26.11.2021 (10 Uhr bis ca. 16 Uhr) bietet das Leibniz-Institut für Deutsche Sprache wieder eine Online-Schulung zum Transkriptions-Editor FOLKER an. Themen dieser Schulung sind:

  • Wie legt man in FOLKER ein Transkript an?
  • Wie führt man die Ersteingabe und Korrekturen einschließlich der Feinsegmentierung in den verschiedenen FOLKER-Ansichten durch?
  • Wie setzt man die cGAT-Konventionen auf der Stufe des Minimaltranskripts in FOLKER um?
  • Wie gibt man Transkripte in ein HTML- oder Textverarbeitungsformat aus?
  • Für welche Zwecke ist FOLKER geeignet?
FOLKER Screenshot Segmente-Ansicht

Hierzu sind alle Interessierten herzlich eingeladen.
Wir werden gemeinsam mit einer vom IDS bereitgestellten Aufnahme ein Minimaltranskript anlegen und Korrekturen sowie die Feinsegmentierung in den verschiedenen FOLKER-Ansichten durchführen. Die Teilnehmerinnen und Teilnehmer haben Gelegenheit, eine Übungsdatei oder ihre eigenen Aufnahmen zu bearbeiten und eventuelle Transkriptionsprobleme zu besprechen.
Die Schulung wird über das Videokonferenz-Tool Zoom organisiert, einen digitalen Zugang zur Schulung erhalten Sie nach der Anmeldung. Die Teilnehmerinnen und Teilnehmer sollten über eine Maus (mit Mausrad), Kopfhörer und eine stabile Internetverbindung verfügen und FOLKER vor dem Workshop installieren. Den Transkriptionseditor können Sie als Teil des EXMARaLDA-Paketes kostenlos herunterladen (http://exmaralda.org/de/preview/).
Die Schulung ist kostenlos, die Teilnehmerzahl ist auf 10 beschränkt. Bitte melden Sie sich bis zum 15.11. an (schedl@ids-mannheim.de), wenn Sie an der Schulung teilnehmen möchten.
Weitere Informationen erhalten Sie nach der Anmeldung.

User story: ExmaraldaR – (Annotierte) Transkriptionen in R verarbeiten

Das R-Paket ExmaraldaR soll eine einfache Verarbeitung von (annotierten) Transkripten R (R Core Team 2020) ermöglichen. R ist eine kostenlose Umgebung für statistische Analysen, Datenaufbereitung und auch Natural Language Processing. Damit bietet es zahlreiche Optionen, die auch für die Untersuchung gesprochener Sprache interessant sind. Mit dem Paket können eine oder mehrere annotierte Transkriptionen (*.exb) eingelesen werden. Annotierte Transkripte ergeben dann ein Tabellenobjekt mit dem weitergearbeitet werden kann (s. Abb. 1).

Abb. 1: Tabellenobjekt
Abb. 2: Netzwerkgraph aus einer fiktiven Datei

Die Tabelle enthält eine fortlaufende IP-Nummerierung auf Basis der GAT2-Konventionen (Selting et al. 2009), die Sprechersigle, die ID der Spur, den Sprechernamen, den Transkriptionstext, die Metadaten der Sprechertabelle (optional), Zeitstempel des Events und die Annotationen. Die Annotationen werden dabei direkt dem transkribierten Text zugeordnet. Möglich sind unterschiedliche Transkriptionsformate (komplexe Annotationstags, die aufgetrennt werden, oder mehrere Annotationsspuren).

Deskriptionsspuren können ebenfalls eingebunden werden. In Zukunft soll es zudem möglich sein, in R oder an der Tabelle gemachte Änderungen (z.B. nach einem Export in Excel) direkt zurück in die zugrundeliegenden Dateien zu übernehmen, um die Nachbearbeitung zu vereinfachen. Vorlagen für eine Einbindung in R-Shiny Anwendungen können bei Bedarf erfragt werden (s. Abb. 2). Bei Fragen oder sollten Sie das Paket testen wollen, wenden Sie sich an timo.schuermann@uni-meunster.de

Eine Beta-Version, die beständig weiterentwickelt wird, findet sich hier:

https://github.com/TimoSchuer/ExmaraldaR

Literaturverzeichnis

R Core Team (2020): R. A Language and Environment for Statistical Computing. Version 3.6.0: R Foundation for Statistical Computing. Online verfügbar unter https://www.R-project.org.

Selting, Margret; Auer, Peter; Barth-Weingarten, D.; Bergmann, Jörg; Bergmann, Pia; Birkner, Karin et al. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung 10, S. 353–402.