Projekte

EXMARaLDA wird seit über 20 Jahren weltweit in Forschungsprojekten und in der universitären Lehre für die Arbeit mit mündlichen Daten eingesetzt. Diese Seite gibt einen Überblick über Projekte, die mit EXMARaLDA arbeiten.


SFB 538 MehrsprachigkeitIn den Projekten des Sonderforschungsbereichs 538 Mehrsprachigkeit der Universität Hamburg wurden zwischen 2000 und 2011 viele mündliche Korpora mit EXMARaLDA erstellt, die mehrsprachige Kommunikation und/oder mehrsprachigen Spracherwerb zum Gegenstand haben, z.B.: das Korpus Dolmetschen im Krankenhaus (DiK), das Hamburg Map Task Corpus (HaMaTaC), das Hamburg Adult Bilingual Language Corpus (HABLA), das Community Interpreting Database Pilot Corpus (ComInDat), das Hamburg Corpus of Polish in Germany (HamCoPoliG). Die Korpora des SFB 538 sind über das Hamburger Zentrum für Sprachkorpora bzw. das Zentrum für nachhaltiges Forschungsdatenmanagement der Uni Hamburg verfügbar.

GeWissDas Korpus Gesprochene Wissenschaftssprache Kontrastiv (GeWiss) wurde ab 2009 in einem gemeinsamen Projekt des Herder-Instituts an der Universität Leipzig mit der Aston University (Birmingham) und der Universität Wroclaw mit Hilfe von EXMARaLDA erstellt. Das Korpus dokumentiert deutsche, englische, polnische gesprochene Wissenschaftssprache von Erst- und Zweitsprechern der betreffenden Sprachen an verschiedenen Universitäten in Deutschland, England, Polen, Italien, Bulgarien und Finnland. Es ist über ein Portal an der Universität Leipzig, die Datenbank für Gesprochenes Deutsch und die ZuMult-Tools zugänglich.

FOLKDas Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird im Programmbereich „Mündliche Korpora“ des Leibniz-Instituts für Deutsche Sprache in Mannheim aufgebaut. Es ist ein großes, ständig wachsendes Gesprächskorpus des Deutschen, das die Vielfalt sprachlicher Interaktion in der Gesellschaft abbildet. Für FOLK wurde ein eigener, auf EXMARaLDA-Tools aufbauender Workflow entwickelt, der neben der Transkription auch die orthographische Normalisierung und die Lemmatisierung und das Part-Of-Speech-Tagging der Daten beinhaltet. FOLK ist über die Datenbank für Gesprochenes Deutsch und die ZuMult-Tools zugänglich.

Archiv für Gesprochenes DeutschDas Archiv für Gesprochenes Deutsch (AGD) am Leibniz-Institut für Deutsche Sprache in Mannheim ist das wichtigste Datenzentrum für Korpora des gesprochenen Deutsch. Am AGD werden aktuell ca. 100 Gesprächs-, Variations- und Interviewkorpora archiviert. Viele dieser Korpora wurden mit Hilfe von EXMARaLDA erschlossen, z.B. das Korpus Deutsch Heute (DH), das Korpus Deutsch in Namibia (DNAM), das Korpus Unserdeutsch (UNSD), das Korpus Deutsche Mundarten aka Zwirner-Korpus (ZW). Die Korpora des AGD sind auf dessen Website verzeichnet. Sie sind größtenteils über die Datenbank für Gesprochenes Deutsch, teilweise auch über die ZuMult-Tools zugänglich.

Das auf 18 Jahre Laufzeit ausgelegte Akademie-Vorhaben „Grammatiken, Korpora und Sprachtechnologie für indigene nordeurasische Sprachen“ (INEL) erstellt mit EXMARaLDA umfängliche Sprachdokumentationen für nordeurasische Sprachen. Bereits veröffentlicht wurden Dokumentationen zu: Dolganisch, Kamassisch, Selkupisch, Ewenkisch. Die INEL-Korpora werden über die Projekt-Website zugänglich gemacht.


EXMARaLDA ist weit gereist und spricht viele Sprachen. Es kommt z.B. zum Einsatz:


Weitere Projekte, die mit EXMARaLDA arbeiten, sind in der folgenden Liste aufgeführt. Bitte teilen Sie uns mit, wenn Sie Ihr Projekt oder Korpus gerne auf dieser Liste erwähnt haben möchten.

  1. AG Ton & Korpus Forschungszentrum Deutsch Sprachatlas Marburg
  2. Berlin Maptask Corpus (BeMaTac) – HU Berlin
  3. Bildung durch Sprache und Schrift (BiSS)
  4. Bildungsprozesse, Kompetenzentwicklung und Selektionsentscheidungen im Vor- und Grundschulalter (BiKS) – Universität Bamberg
  5. Bochumer Korpus der gesprochenen Sprache im Ruhrgebiet (KgSR) – Ruhr-Universität Bochum
  6. Competencies of school teachers and adult educators in teaching German as a second language in linguistically diverse classrooms (COLD) – Deutsches Institut für Erwachsenenbildung (DIE), Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache, Leibniz-Institut für Bildungsforschung und Bildungsinformation (DIPF), Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN), Universität Zürich und weitere Partner
  7. Corpus of Read and Spontaneous Upper Saxon German Speech for ASR Evaluation (SXU) – TU Chemnitz, HTW Dresden
  8. Corpus of Turkish Youth Language (CoTY) – METU Ankara
  9. Deutsch und Dänisch bei nordschleswigdeutschen Schülern – Universität Kiel
  10. Dialogisches Lesen als Tool für eine wirksame Praxis der Sprachförderung in Kindertagesstätten (DiaLes) – Universität Hamburg
  11. Die Dynamiken des Deutschen im mehrsprachigen Kontext des südlichen Afrika – FU Berlin
  12. Digitaler Alltag im Alter: Neue Technologien und Medien in der sozialen Interaktion älterer Teilnehmer:innen (DigiLife) – Leibniz-Institut für Deutsche Sprache, Universitäten Freiburg, Münster, Oulu, Zürich, WU Wien, Instituts für Tschechische Sprache in Prag
  13. Emerging Grammars in Language Contact Situations (RUEG) – HU Berlin
  14. Empirische Linguistik und LautSprachAnalyse (ELLSA) – Universität Hamburg
  15. Entwicklung der mündlichen und schriftlichen Kompetenzen und der Erst-, Zweit- und Fremdsprache bei mehrsprachigen Kindern und Jugendlichen mit türkischem Hintergrund in Frankreich und Deutschland (MULTILIT) – Universität Potsdam, Université Lumière Lyon 2
  16. Fehlerannotiertes Lernerkorpus (FALKO) – HU Berlin
  17. Forschungsinitiative Sprachdiagnostik und Sprachförderung (FiSS) – Universität Hamburg und weitere Partner
  18. Fragesequenzen im Coaching – Leibniz-Institut für Deutsche Sprache, Universität Klagenfurt, ZHAW Zürich
  19. Frühneuzeitliche Fürstinnenkorrespondenzen im mitteldeutschen Raum – Universität Jena, HU Berlin
  20. Gelingende Kommunikation im Alter (Ge-Kom) — Europäische Fachhochschule Brühl
  21. Gesprächstranskripte für die Lehre: Korpusaufbau und -aufbereitung im curricularen Kontext (DGK) – Heinrich-Heine-Universität Düsseldorf
  22. Gestikkorpora in der universitären DAF-Lehrkräfteausbildung – LMU München
  23. Informationsstruktur in komplexen Sätzen – Synchron und diachron – Universität Jena
  24. Interaktives Annotieren von Unterrichtskommunikation – Universität Hamburg
  25. International Comparable Corpus (ICC) – Universitäten Wien, Birmingham, Oslo, Prag, Göteborg, Jyvaskyla, Paderborn, Polnische Akademie der Wissenschaften, Slowakische Akademie der Wissenschaften, Leibniz-Institut für Deutsche Sprache
  26. Jugendsprache im Längsschnitt (JuSpiL) – FU Berlin
  27. Kicktionary – ICSI Berkeley
  28. Kiezdeutsch-Korpus (KidKo) – Universität Potsdam, HU Berlin
  29. Klausurenkorpus (GraphVar) – Universität Bonn
  30. Kommunikatives Repertoire von Migrant*innen – Leibniz-Institut für Deutsche Sprache
  31. Korpus norddeutscher Tischgespräche (KONTI) – Universität Duisburg-Essen
  32. LAST MINUTE: a Multimodal Corpus of Speech-based User-Companion Interactions – Universität Magdeburg
  33. Lexik des gesprochenen Deutsch (LeGeDe) – Leibniz-Institut für Deutsche Sprache
  34. Linguistische Profilierung einer europäischen Wissenschaftsbildung (euroWiss) – Universität Hamburg, TU Chemnitz, Università degli Studi di Bergamo, Università degli Studi die Modena et Reggio Emilia
  35. Linked TV –  Fraunhofer IAIS, Rundfunk Berlin-Brandenburg, Universität St. Gallen und 9 weitere Partner
  36. Literacy as the key to social participation: Psycholinguistic perspectives on orthography instruction and literacy acquisition (LitKey) – Ruhr-Universität Bochum
  37. Mehrsprachigkeit und Sprachentwicklungsstörungen als Einflussfaktoren im Spracherwerb (MILA) – Universität Frankfurt/Main
  38. Mehrsprachigkeitsentwicklung im Zeitverlauf – Universität Hamburg
  39. Mitschreiben in Vorlesungen (Miko) – Universität Leipzig
  40. Multilingualism and Multiculturalism in University Studies (MuMiS) – Universitäten Siegen, Hamburg, Kassel
  41. Multilingual Platform for European Reference Levels: Interlanguage Exploration in Context (MERLIN) – TU Dresden, European Academy Bozen, Universität Tübingen, Karlsuniversität Prag und weitere Partner
  42. Niederdeutsch in Hamburg (NiH) – Universität Hamburg
  43. Norms, Rules, and Morality across Languages (NoRM-aL) – Leibniz-Institut für Deutsche Sprache, Universität Basel, Universität Helsinki, Kazmierz Wielki University Bydgoszcz, University of California at Los Angeles
  44. PolDi – a Polish Diachronic Online Corpus – Universität Regensburg
  45. Pommersch in Brasilien – Universität Freiburg
  46. Postmigrantische Familienkulturen (PoMiKu) – Universität Hamburg, HAW Hamburg
  47. Professionalisierung von Anfang an im Jenaer Modell der Lehrerbildung (PROFJL2) – Universität Jena
  48. Rechtschreibgespräche – Gemeinsames Lernen im Deutschunterricht der Grundschule – Universität Leipzig
  49. Regularität und Irregularität in der Kasusmorphologie deutscher Sprachinselvarietäten (Russland, Brasilien): intralinguale, interlinguale, typologische Konvergenz – Universität Frankfurt/Oder
  50. RRuDi – a Russian Diachronic Online Corpus – Universität Regensburg
  51. Russische und polnische Herkunftssprache als Ressource im Schulunterricht? – Universität Greifswald
  52. Schmerzdarstellung und Krankheitserzählungen – Universität Wien
  53. Schreiben zwischen Sprachen und Kulturen: Ressource und Hemmnis der Integration (LiLac) – TU Dortmund
  54. Segmentation of Oral Corpora (SegCor) – Leibniz-Institut für Deutsche Sprache, Université de Lyon, Université d’Orléans
  55. Sonderforschungsbereich 632 Informationsstruktur – Universität Potsdam
  56. Soziale Interaktion mit Sprachassistenten – Leibniz-Institut für Deutsche Sprache
  57. Soziolinguistik live – Universität Hamburg
  58. Sprachalltag II : Sprachatlas – Digitalisierung – Nachhaltigkeit – Universität Tübingen
  59. Sprachförderung im Mathematikunterricht unter Berücksichtigung der Mehrsprachigkeit (MuM-Multi) – Universität Hamburg, TU Dortmund
  60. SPRachförderung im Übergang KindergarteN – Grundschule Evaluieren (SPRÜNGE) – Universität Frankfurt/Main
  61. Sprachvariation in Norddeutschland (SiN) – Universitäten Hamburg, Bielefeld, Münster, Potsdam, Kiel, Frankfurt/Oder
  62. Sprechen – Schreiben – Visualisieren. Formen, Funktionen und Störungen von Modalitätsinterdependenzen und Konzeptgenesen in professionellen Interaktionssituationen (ModiKo) – RWTH Aachen, Leibniz-Institut für Deutsche Sprache
  63. Texas German Dialect Project (TGDP) – University of Texas, Austin
  64. Translation of Audio Description Scripts (TADS) – Universität Hildesheim, INSPE de Paris
  65. Transmodale Messenger-Chats – Universität Münster
  66. Turn-Taking und Verständnissicherung beim Telefondolmetschen Arabisch-Deutsch – Universität Mainz
  67. Türkisch-Englisch-Deutsch bei Herkunftssprechern (TEDH) – Universität Konstanz
  68. Unserdeutsch – Rabaul Creole German – Universitäten Augsburg, Bern
  69. URUM documentation project – Universität Bielefeld
  70. Verknüpfte Analyse von Mehrsprachigkeiten am Beispiel der Universität Salzburg (VAMUS) – Universitäten Innsbruck und Salzburg
  71. Video corpus of broadcasts of various Let´s Play (LP) channels – Universität Paderborn
  72. Vietnamesisches Lernerkorpus (VIELKO) – Universität Leipzig
  73. Wahrnehmungsdialektologie – Universität Kiel