EG-Spanisch-Korpus im Schweizer LaRS/SWISSUbase-Repositorium

Von Sandra Schlumpf-Thurnherr (Universität Basel)

Das EG-Spanisch Corpus wurde im Rahmen des Forschungsprojekts „Improving the visibility of Equatorial Guinea as a Spanish-speaking country“ erstellt, das vom Schweizerischen Nationalfonds finanziert (Projektnummer 192228, https://data.snf.ch/grants/grant/192228, PI: Sandra Schlumpf-Thurnherr) und an der Universität Basel in der Schweiz durchgeführt wurde.

Eines der Hauptziele des Forschungsprojekts war die Durchführung einer systematischen und methodisch breit angelegten Datenerhebung in Äquatorialguinea, einer ehemaligen Kolonie Spaniens und heute einziges spanischsprachiges Land in Zentralafrika. Die Daten wurden während eines einmonatigen Forschungsaufenthalts im Jahr 2022 in Äquatorialguinea von Sandra Schlumpf-Thurnherr und Sara Carreira erhoben. Um einen Eindruck von der geografischen Vielfalt der soziolinguistischen Landschaft innerhalb des Landes zu gewinnen, arbeiteten wir sowohl auf der Insel Bioko, wo sich die Hauptstadt Malabo befindet, als auch im kontinentalen Teil des Landes, Río Muni. Insgesamt enthält das EG-Spanisch-Korpus Daten von 186 Teilnehmer:innen (89 Männer, 97 Frauen), die in verschiedenen Teilen des Landes leben, sowohl in städtischen als auch in ländlichen Gebieten, und unterschiedliche soziodemografische Profile in Bezug auf Alter, ethnische Zugehörigkeit, Geburtsort, Bildungsniveau und berufliche Situation aufweisen.

Das EG-Spanish Corpus ist in seiner Art einzigartig und daher von großer Relevanz für Forscher:innen, die sich für die spanische Sprache im Allgemeinen und insbesondere für die sprachliche Situation in Äquatorialguinea interessieren. Bislang wurden verschiedene dialektologische und soziolinguistische Analysen durchgeführt, beispielsweise zum aktuellen Gebrauch und Prestige des Spanischen in Äquatorialguinea, zu Spracheinstellungen und Ideologien (z. B. Schlumpf 2025), die Sprachkontaktsituation zwischen Spanisch und lokalen Sprachen wie Fang, Bubi und Pichi sowie zu ausgewählten morphosyntaktischen Merkmalen des äquatorialguineischen Spanisch (z. B. Carreira 2024).

Konkret umfasst das EG-Spanisch-Korpus Daten, die mit fünf verschiedenen Datenerhebungsmethoden gesammelt wurden (weitere Details siehe Schlumpf & Carreira 2024): einen soziolinguistischen Fragebogen (Daten von allen 186 an der Studie beteiligten Teilnehmer:innen); einen linguistischen Fragebogen (152 Teilnehmer: 73 Männer, 79 Frauen); eine narrative Aufgabe, die aus einer adaptierten Version der Geschichte „Frog, where are you?“ von Mercer Mayer, 1969, bestand (135 Teilnehmer: 66 Männer, 69 Frauen); ein halbstrukturiertes Interview in Form eines Lebensgeschichten-Interviews (62 Interviews: 30 Männer, 32 Frauen, insgesamt 47 Stunden und 37 Minuten); und ein Verbal Guise Test (58 Teilnehmer: 35 Männer, 23 Frauen).

Die Erzählaufgabe und eine Auswahl von 36 Interviews wurden mit EXMARaLDA transkribiert. Dies entspricht insgesamt 393 Minuten (43 925 Token) im Fall der 135 Erzählaufgaben und insgesamt 27 Stunden und 52 Minuten (263 698 Token) im Fall der ausgewählten Interviews. Anschließend wurde mit TreeTagger ein POS-Tagging durchgeführt. Schließlich ermöglichte EXMARaLDA dank der integrierten Analysesoftware EXAKT (EXMARaLDA Analyse- und Konkordanztool) (meta-)linguistische Suchen und die Annotation von Konkordanzen.

Die schriftlichen Daten (soziolinguistischer und linguistischer Fragebogen, Fragebogen des Verbal Guise Test) wurden aufgrund der Gegebenheiten vor Ort von Hand auf Papier erfasst. Alle Daten wurden anschließend digitalisiert und systematisch aufbereitet, damit sie mit SPSS verarbeitet werden konnten.

Nun wurde das Projekt auch im LaRS (Language Repository of Switzerland) registriert, das beim Schweizer Repositorium SWISSUbase gehostet wird. Dies ist ein sehr wichtiger Schritt, um die Sichtbarkeit Äquatorialguineas nicht nur innerhalb der Schweizer Forschungsgemeinschaft, sondern auch international zu erhöhen. Allgemeine Informationen über das Projekt sowie Details zu den verschiedenen Datensätzen des EG-Spanisch-Korpus, denen jeweils eine permanente DOI zugewiesen wurde (siehe unten), sind abrufbar: der soziolinguistische Fragebogen, der linguistische Fragebogen, das halbstrukturierte Interview, die narrative Aufgabe und der Verbal Guise Test.

Obwohl die meisten Forschungsdaten aus Datenschutzgründen nicht online verfügbar gemacht werden konnten, wurden für jeden Datensatz Metadaten gespeichert. Darüber hinaus stehen im Fall der narrativen Aufgabe die vollständigen Transkripte zum Download im Open Access zur Verfügung. Interessierte Forscher:innen können sich auch an die Hauptforscherin wenden, um weitere Informationen über das Projekt und die Forschungsdaten zu erhalten.

Referenzen

Journal-Artikel und Beiträge in Sammelbänden

Carreira, S. (2024). El español en contacto con lenguas bantúes y el francés: nuevos datos acerca de la estructura «verbo de movimiento + a / en + destino» en el español de Guinea Ecuatorial. Revista de Investigación Lingüística, 27, pp. 15-39. https://doi.org/10.6018/ril.592821

Schlumpf, S. (2025). Between the Local and the Global: Language Ideologies in Post-Colonial Equatorial Guinea. In: Bürki, Y., & A. N. García Agüero (Eds.): Language, Borders and Bordering Practices / Lenguaje, fronteras y prácticas de fronterización: Sociolinguistic Perspectives / Perspectivas sociolingüísticas. Berlin & Boston: De Gruyter, pp. 435-466. https://doi.org/10.1515/9783111034225-016

Schlumpf, S., & Carreira, S. (2024). Presentación de un corpus para el estudio del español actual en Guinea Ecuatorial. Boletín de Filología 59:1, pp. 403-436. https://boletinfilologia.uchile.cl/index.php/BDF/article/view/75046/76420

Datensätze

Schlumpf-Thurnherr, S. (2025). EG-Spanish Corpus: Sociolinguistic questionnaire (Version 1.0) [Data set]. LaRS – Language Repository of Switzerland. https://doi.org/10.48656/k5v5-2869

Schlumpf-Thurnherr, S., & Carreira, S. (2025). EG-Spanish Corpus: Linguistic questionnaire (Version 1.0) [Data set]. LaRS – Language Repository of Switzerland. https://doi.org/10.48656/kq3s-dv13

Schlumpf-Thurnherr, S. (2025). EG-Spanish Corpus: Semi-structured interview (Version 1.0) [Data set]. LaRS – Language Repository of Switzerland. https://doi.org/10.48656/g9eg-an83

Schlumpf-Thurnherr, S., & Carreira, S. (2025). EG-Spanish Corpus: Narrative task (Version 1.0) [Data set]. LaRS – Language Repository of Switzerland. https://doi.org/10.48656/8q22-3z08

Schlumpf-Thurnherr, S. (2025). EG-Spanish Corpus: Verbal Guise Test (Version 1.0) [Data set]. LaRS – Language Repository of Switzerland. https://doi.org/10.48656/m8jw-0b66