User story: ExmaraldaR – (Annotierte) Transkriptionen in R verarbeiten

Das R-Paket ExmaraldaR soll eine einfache Verarbeitung von (annotierten) Transkripten R (R Core Team 2020) ermöglichen. R ist eine kostenlose Umgebung für statistische Analysen, Datenaufbereitung und auch Natural Language Processing. Damit bietet es zahlreiche Optionen, die auch für die Untersuchung gesprochener Sprache interessant sind. Mit dem Paket können eine oder mehrere annotierte Transkriptionen (*.exb) eingelesen werden. Annotierte Transkripte ergeben dann ein Tabellenobjekt mit dem weitergearbeitet werden kann (s. Abb. 1).

Abb. 1: Tabellenobjekt
Abb. 2: Netzwerkgraph aus einer fiktiven Datei

Die Tabelle enthält eine fortlaufende IP-Nummerierung auf Basis der GAT2-Konventionen (Selting et al. 2009), die Sprechersigle, die ID der Spur, den Sprechernamen, den Transkriptionstext, die Metadaten der Sprechertabelle (optional), Zeitstempel des Events und die Annotationen. Die Annotationen werden dabei direkt dem transkribierten Text zugeordnet. Möglich sind unterschiedliche Transkriptionsformate (komplexe Annotationstags, die aufgetrennt werden, oder mehrere Annotationsspuren).

Deskriptionsspuren können ebenfalls eingebunden werden. In Zukunft soll es zudem möglich sein, in R oder an der Tabelle gemachte Änderungen (z.B. nach einem Export in Excel) direkt zurück in die zugrundeliegenden Dateien zu übernehmen, um die Nachbearbeitung zu vereinfachen. Vorlagen für eine Einbindung in R-Shiny Anwendungen können bei Bedarf erfragt werden (s. Abb. 2). Bei Fragen oder sollten Sie das Paket testen wollen, wenden Sie sich an timo.schuermann@uni-meunster.de

Eine Beta-Version, die beständig weiterentwickelt wird, findet sich hier:

https://github.com/TimoSchuer/ExmaraldaR

Literaturverzeichnis

R Core Team (2020): R. A Language and Environment for Statistical Computing. Version 3.6.0: R Foundation for Statistical Computing. Online verfügbar unter https://www.R-project.org.

Selting, Margret; Auer, Peter; Barth-Weingarten, D.; Bergmann, Jörg; Bergmann, Pia; Birkner, Karin et al. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung 10, S. 353–402.