Transcription conventions

The following transcription conventions are supported by EXMARaLDA. This page lists the most important resources documenting the conventions.

HIAT: Semi-Interpretative Working Transcriptions

Manual for computer-assisted transcription

Rehbein, Jochen/Schmidt, Thomas/Meyer, Bernd/Watzke, Franziska/Herkenrath, Annette (2004):
Handbuch für das computergestützte Transkribieren nach HIAT. (= Arbeiten zur Mehrsprachigkeit, Folge B 56). Hamburg: Universität Hamburg, 2004.

Example collection

A collection of examples for HIAT and EXMARaLDA:

HIAT and Turkish

Ruhi, Şükriye / Hatipoglu, Çiler / Işık Güler, Hale / Eröz Tuğa, Betil (2010):
A Guideline for Transcribing Conversations for the Construction of Spoken Turkish Corpora using EXMARaLDA and HIAT.

HIAT and Arabic

Farag, Rahaf (2019):
Conversation-analytic transcription of Arabic-German talk-in-interaction. In: Working Papers in Corpus Linguistics and Digital Technologies – Analyses and methodology, vol. 2. Univ. Szeged: Szeged. 50 S. 

GAT: Conversation Analytic Transcription System

Manual for computer-assisted transcription (cGAT)

Schmidt, Thomas / Schütte, Wilfried / Winterscheid, Jenny / Schürmann, Mia / Reineke, Silke / Schedl, Evi (2023):
cGAT. Konventionen für das computergestützte Transkribieren in Anlehnung an das Gesprächsanalytische Transkriptionssystem 2 (GAT2).

Original conventions in German, translations / adaptions to English, Spanish and Portuguese

Selting, Margret / Auer, Peter / Barth-Weingarten, Dagmar / Bergmann, Jörg R. / Bergmann, Pia / Birkner, Karin / Couper-Kuhlen, Elizabeth / Deppermann, Arnulf / Gilles, Peter / Günthner, Susanne / Hartung, Martin / Kern, Friederike / Mertzlufft, Christine / Meyer, Christian / Morek, Miriam / Oberzaucher, Frank / Peters, Jörg / Quasthoff, Uta / Schütte, Wilfried / Stukenbrock, Anja / Uhmann, Susanne (2009):
Gesprächsanalytisches Transkriptionssystem 2 (GAT 2).

Couper-Kuhlen, Elizabeth / Barth-Weingarten, Dagmar (2011):
A system for transcribing talk-in-interaction: GAT 2.

Ehmer, Oliver / Satti, Luis Ignacio / Martínez, Angelita / Pfänder, Stefan (2019):
Un sistema para transcribir el habla en la interacción: GAT 2.
Examples for this publication: []

Schröder, Ulrike / Mendes, Mariana Carneiro / Pires, Caroline Caputo / da Silva, Diogo Henrique Alves / da Cunha Nascimento, Thiago / de Paula, Flavia Fidelis (2016):
Um sistema para transcrever a fala-em-interação: GAT 2. Veredas : Revista de Estudos Linguísticos. 2016, 20(2), pp. 6-61. ISSN 1415-2533.

CHAT: Codes for the Human Analysis of Transcripts

MacWhinney, Brian (2024):
Tools for Analyzing Talk Part 1: The CHAT Transcription Format.

Beeh, Christoph / Drewnowska-Vargáné, Ewa / Kappel, Péter / Modrián-Horváth, Bernadett / Nolda, Andreas / Rauzs, Orsolya / Scheibl, György (2021):
Dulko-Handbuch: Aufbau und Annotationsverfahren des deutsch-ungarischen Lernerkorpus. Version 1.0. Manuscript, Universität Szeged.

Nolda, Andreas (2024):
Die Dulko-Tools des EXMARaLDA Partitur-Editors. Von einer externen Toolsammlung zum integrierten Bestandteil. Korpora Deutsch als Fremdsprache 4(2), 224–235.

INEL: General Transcription and Annotation Principles (Language Documentation)

Arkhipov, Alexandre (2020):
INEL Corpora General Transcription and Annotation Principles. Working Papers in Corpus Linguistics and Digital Technologies: Analyses and Methodology (Vol.5).

DIDA: Discourse Database

Institut für Deutsche Sprache (2004):
Transkriptionsrichtlinien für die Eingabe in DIDA.

IPA: International Phonetic Alphabet


Further annotation guidelines

STTS 2.0: Part-of-Speech Tagging for German

Westpfahl, Swantje / Schmidt, Thomas / Jonietz, Jasmin / Borlinghaus, Anton (2017):
STTS 2.0. Guidelines für die Annotation von POS -Tags für Transkripte gesprochener Sprache in Anlehnung an das Stuttgart Tübingen Tagset (STTS).

Westpfahl, Swantje / Schmidt, Thomas (2013):
POS für(s) FOLK – Part of Speech Tagging des Forschungs- und Lehrkorpus Gesprochenes Deutsch. Journal for Language Technology and Computational Linguistics, (2013) 1.

Orthographic Normalisation

Winterscheid, Jenny / Deppermann, Arnulf / Schmidt, Thomas / Schütte, Wilfried / Schedl, Evi / Kaiser, Julia (2019):
Normalisieren mit OrthoNormal. Konventionen und Bedienungshinweise für die orthografische Normalisierung von FOLKER-Transkripten.

Blevins, Margaret (2022):
The language-tagging & orthographic normalization of spoken mixed-language data, with a focus on Texas German.

Syntactic Segmentation

Westpfahl, Swantje / Schmidt, Thomas / Borlinghaus, Anton / Strub, Hanna (2019):
Guideline: syntaktische Segmentierung in FOLKER.