For over twenty years, EXMARaLDA has been used for work with oral corpora in research and teaching projects all over the world. This page provides an overview of projects working with EXMARaLDA.
The projects of the Special Research Centre on Multilingualism at the University of Hamburg have used EXMARaLDA between 2000 and 2011 to compile a large set of oral corpora dealing with multilingual communication and/or multilingual language acquistion, such as: the corpus Interpreting in Hospitals (DiK), the Hamburg Map Task Corpus (HaMaTaC), the Hamburg Adult Bilingual Language Corpus (HABLA), the Community Interpreting Database Pilot Corpus (ComInDat), the Hamburg Corpus of Polish in Germany (HamCoPoliG). The corpora of the Research Centre are available via the Hamburg Centre for Language Corpora or the Centre for Sustainable Research Data Management at the University of Hamburg.
The GeWiss Corpus of Spoken Academic Language was compiled with EXMARaLDA in a joint project by the Herder Institute at the University of Leipzig, Aston Uiversity (Birmingham) and the University of Wroclaw starting in 2009. The corpus documents German, English and Polish spoken academic language of L1 and L2 speakers of the respective languages in Germany, England, Poland, Italy, Bulgaria and Finland. It is available via a platform at the University of Leipzig, the Database for Spoken German and the ZuMult tools.
Das Research and Teaching Corpus of Spoken German (FOLK) is being built-up at the program are „Oral Corpora“ of the Leibniz Institute for the German language in Mannheim. It is a large, continuously growing interaction corpus of German which attempts to represent the diversity of social interaction. The FOLK project has developped a full workflow based on EXMARaLDA tools which covers not only transcription but also orthographic normalisation, lemmatisation and Part-Of-Speech tagging. FOLK can be accessed via the Database for Spoken German and the ZuMult tools.
The Archive for Spoken German (AGD) at the Leibniz Institute for the German Language in Mannheim is the most important research data centre for corpora of spoken German. The AGD currently hosts around 100 interaction, variation and interview corpora. Many of those corpora were compiled and/or processed with EXMARaLDA, e.g.. the corpus German Today (DH), the corpus German in Namibia (DNAM), the corpous Rabaul Creole German (UNSD), the corpus German Dialects (ZW). The AGD corpora are listed on the archive’s website. Most of them can be accessed via the Datenbase for Spoken German, some of them additionally via the ZuMult tools.
The academy long-term project „Grammatical Descriptions, Corpora, and Language Technology for Indigenous Northern Eurasian Languages“ (INEL) uses EXMARaLDA to compile comprehensive language documentation for Northern Eurasian languages. So far, documentations for Dolga, Selkup, Kamas and Evenki have been published. The INEL corpora are made available via the project website.
EXMARaLDA has travelled far and speaks a lot of languages. For instance, it is being used:
- At METU Ankara and METU North Cyprus for a Reference Corpus of spoken Turkish and the Corpus of Turkish Youth Language (CoTY)
- At the University of Lisbon for the Reference Corpus of Contemporary Portuguesen Portugiesisch and at the University of Braga for the Perfil Sociolinguístico da Fala Brancese
- At the Universidade Federal de Minas Gerais (Brazil) for the project Comunicação Intercultural em Interação: expansão e diversificação do Corpus NUCOI
- At the University of Ghent for the European Parliament Interpreting Corpus Ghent (EPICG)
- At the University of Sofia for the Bulgarian Speech Corpus
- At the University of Szeged (Hungary) for the German-Hungarian learner corpus (DULKO)
- At the University of Maribor (Slovenia) for the Mezzanine project
- At the University of Austin/Texas for the Texas German Dialect Project (TDGP)
- At Aston University (Birmingham) for documentation of the West Midland Dialects: Aston Corpus of West Midlands English (ACWME)
- At the University of Taru (Estonia) for a corpus of English as a Lingua Franca
- At the Universitat Autónoma de Barcelona for Catalan and Spanish data in the project Traducción e Interpretación en los Procesos penales (TIPp)
- At the University of Basel for documentation of Spanish inEquatorial Guinea
- At the University of Zürich for documentation of the Serbian Torlak dialect and the Map Task Corpus of Heritage BCMS
- At different universities in Austria, participating in projects of the Special Research Centre German in Austria (DiÖ)
- In Switzerland and for Swiss German for the ArchiMob-Korpus (University of Zürich), in the project Kompetenzniveaus mündlichen Argumentierens unter Schulkindern (University of Basel) for the Parsed and grammatically annotated corpus of Swiss German spontaneous language (University of Geneva)
Further projects working with EXMARaLDA are listed in what follows. Please let us know if you want to see your corpus or project included in this list.
- AG Ton & Korpus – Forschungszentrum Deutsch Sprachatlas Marburg
- Berlin Maptask Corpus (BeMaTac) – HU Berlin
- Bildung durch Sprache und Schrift (BiSS)
- Bildungsprozesse, Kompetenzentwicklung und Selektionsentscheidungen im Vor- und Grundschulalter (BiKS) – Universität Bamberg
- Bochumer Korpus der gesprochenen Sprache im Ruhrgebiet (KgSR) – Ruhr-Universität Bochum
- Competencies of school teachers and adult educators in teaching German as a second language in linguistically diverse classrooms (COLD) – Deutsches Institut für Erwachsenenbildung (DIE), Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache, Leibniz-Institut für Bildungsforschung und Bildungsinformation (DIPF), Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN), Universität Zürich und weitere Partner
- Corpus of Read and Spontaneous Upper Saxon German Speech for ASR Evaluation (SXU) – TU Chemnitz, HTW Dresden
- Corpus of Turkish Youth Language (CoTY) – METU Ankara
- Deutsch und Dänisch bei nordschleswigdeutschen Schülern – Universität Kiel
- Dialogisches Lesen als Tool für eine wirksame Praxis der Sprachförderung in Kindertagesstätten (DiaLes) – Universität Hamburg
- Die Dynamiken des Deutschen im mehrsprachigen Kontext des südlichen Afrika – FU Berlin
- Digitaler Alltag im Alter: Neue Technologien und Medien in der sozialen Interaktion älterer Teilnehmer:innen (DigiLife) – Leibniz-Institut für Deutsche Sprache, Universitäten Freiburg, Münster, Oulu, Zürich, WU Wien, Institut für Tschechische Sprache in Prag
- Emerging Grammars in Language Contact Situations (RUEG) – HU Berlin
- Empirische Linguistik und LautSprachAnalyse (ELLSA) – Universität Hamburg
- Entwicklung der mündlichen und schriftlichen Kompetenzen und der Erst-, Zweit- und Fremdsprache bei mehrsprachigen Kindern und Jugendlichen mit türkischem Hintergrund in Frankreich und Deutschland (MULTILIT) – Universität Potsdam, Université Lumière Lyon 2
- Fehlerannotiertes Lernerkorpus (FALKO) – HU Berlin
- Forschungsinitiative Sprachdiagnostik und Sprachförderung (FiSS) – Universität Hamburg und weitere Partner
- Fragesequenzen im Coaching – Leibniz-Institut für Deutsche Sprache, Universität Klagenfurt, ZHAW Zürich
- Frühneuzeitliche Fürstinnenkorrespondenzen im mitteldeutschen Raum – Universität Jena, HU Berlin
- Gelingende Kommunikation im Alter (Ge-Kom) — Europäische Fachhochschule Brühl
- Gesprächstranskripte für die Lehre: Korpusaufbau und -aufbereitung im curricularen Kontext (DGK) – Heinrich-Heine-Universität Düsseldorf
- Gestikkorpora in der universitären DAF-Lehrkräfteausbildung – LMU München
- Informationsstruktur in komplexen Sätzen – Synchron und diachron – Universität Jena
- Interaktives Annotieren von Unterrichtskommunikation – Universität Hamburg
- International Comparable Corpus (ICC) – Universitäten Wien, Birmingham, Oslo, Prag, Göteborg, Jyvaskyla, Paderborn, Polnische Akademie der Wissenschaften, Slowakische Akademie der Wissenschaften, Leibniz-Institut für Deutsche Sprache
- Jugendsprache im Längsschnitt (JuSpiL) – FU Berlin
- Kicktionary – ICSI Berkeley
- Kiezdeutsch-Korpus (KidKo) – Universität Potsdam, HU Berlin
- Klausurenkorpus (GraphVar) – Universität Bonn
- Kommunikatives Repertoire von Migrant*innen – Leibniz-Institut für Deutsche Sprache
- Korpus norddeutscher Tischgespräche (KONTI) – Universität Duisburg-Essen
- LAST MINUTE: a Multimodal Corpus of Speech-based User-Companion Interactions – Universität Magdeburg
- Lexik des gesprochenen Deutsch (LeGeDe) – Leibniz-Institut für Deutsche Sprache
- Linguistische Profilierung einer europäischen Wissenschaftsbildung (euroWiss) – Universität Hamburg, TU Chemnitz, Università degli Studi di Bergamo, Università degli Studi die Modena et Reggio Emilia
- Linked TV – Fraunhofer IAIS, Rundfunk Berlin-Brandenburg, Universität St. Gallen und 9 weitere Partner
- Literacy as the key to social participation: Psycholinguistic perspectives on orthography instruction and literacy acquisition (LitKey) – Ruhr-Universität Bochum
- Mehrsprachigkeit und Sprachentwicklungsstörungen als Einflussfaktoren im Spracherwerb (MILA) – Universität Frankfurt/Main
- Mehrsprachigkeitsentwicklung im Zeitverlauf – Universität Hamburg
- Mitschreiben in Vorlesungen (Miko) – Universität Leipzig
- Multilingualism and Multiculturalism in University Studies (MuMiS) – Universitäten Siegen, Hamburg, Kassel
- Multilingual Platform for European Reference Levels: Interlanguage Exploration in Context (MERLIN) – TU Dresden, European Academy Bozen, Universität Tübingen, Karlsuniversität Prag und weitere Partner
- Niederdeutsch in Hamburg (NiH) – Universität Hamburg
- Norms, Rules, and Morality across Languages (NoRM-aL) – Leibniz-Institut für Deutsche Sprache, Universität Basel, Universität Helsinki, Kazmierz Wielki University Bydgoszcz, University of California at Los Angeles
- PolDi – a Polish Diachronic Online Corpus – Universität Regensburg
- Pommersch in Brasilien – Universität Freiburg
- Postmigrantische Familienkulturen (PoMiKu) – Universität Hamburg, HAW Hamburg
- Professionalisierung von Anfang an im Jenaer Modell der Lehrerbildung (PROFJL2) – Universität Jena
- Rechtschreibgespräche – Gemeinsames Lernen im Deutschunterricht der Grundschule – Universität Leipzig
- Regularität und Irregularität in der Kasusmorphologie deutscher Sprachinselvarietäten (Russland, Brasilien): intralinguale, interlinguale, typologische Konvergenz – Universität Frankfurt/Oder
- RRuDi – a Russian Diachronic Online Corpus – Universität Regensburg
- Russische und polnische Herkunftssprache als Ressource im Schulunterricht? – Universität Greifswald
- Schmerzdarstellung und Krankheitserzählungen – Universität Wien
- Schreiben zwischen Sprachen und Kulturen: Ressource und Hemmnis der Integration (LiLac) – TU Dortmund
- Segmentation of Oral Corpora (SegCor) – Leibniz-Institut für Deutsche Sprache, Université de Lyon, Université d’Orléans
- Sonderforschungsbereich 632 Informationsstruktur – Universität Potsdam
- Soziale Interaktion mit Sprachassistenten – Leibniz-Institut für Deutsche Sprache
- Soziolinguistik live – Universität Hamburg
- Sprachalltag II : Sprachatlas – Digitalisierung – Nachhaltigkeit – Universität Tübingen
- Sprachförderung im Mathematikunterricht unter Berücksichtigung der Mehrsprachigkeit (MuM-Multi) – Universität Hamburg, TU Dortmund
- SPRachförderung im Übergang KindergarteN – Grundschule Evaluieren (SPRÜNGE) – Universität Frankfurt/Main
- Sprachvariation in Norddeutschland (SiN) – Universitäten Hamburg, Bielefeld, Münster, Potsdam, Kiel, Frankfurt/Oder
- Sprechen – Schreiben – Visualisieren. Formen, Funktionen und Störungen von Modalitätsinterdependenzen und Konzeptgenesen in professionellen Interaktionssituationen (ModiKo) – RWTH Aachen, Leibniz-Institut für Deutsche Sprache
- Texas German Dialect Project (TGDP) – University of Texas, Austin
- Translation of Audio Description Scripts (TADS) – Universität Hildesheim, INSPE de Paris
- Transmodale Messenger-Chats – Universität Münster
- Turn-Taking und Verständnissicherung beim Telefondolmetschen Arabisch-Deutsch – Universität Mainz
- Türkisch-Englisch-Deutsch bei Herkunftssprechern (TEDH) – Universität Konstanz
- Unserdeutsch – Rabaul Creole German – Universitäten Augsburg, Bern
- URUM documentation project – Universität Bielefeld
- Verknüpfte Analyse von Mehrsprachigkeiten am Beispiel der Universität Salzburg (VAMUS) – Universitäten Innsbruck und Salzburg
- Video corpus of broadcasts of various Let´s Play (LP) channels – Universität Paderborn
- Vietnamese learner corpus (VIELKO) – Universität Leipzig
- Wahrnehmungsdialektologie – Universität Kiel