EXMARaLDA und Automatische Spracherkennung

Automatische Spracherkennung („Speech-To-Text“, ASR) hat in den letzten Jahren signifikante Forstschritte gemacht. In manchen Szenarien kann sie die manuelle Transkription mittlerweile ersetzen oder zumindest zur Effizienzsteigerung ergänzen. Das neueste EXMARaLDA-Preview trägt dem Rechnung, indem es neue und überarbeitete Importfunktionen für Formate zur Verfügung stellt, die üblicherweise von ASR-System ausgegeben werden. Dies sind zum einen die SRT- und VTT-Formate, die ihren Ursprung in der Untertitelung von Videos haben. Zum anderen können der EXMARaLDA Partitur-Editor und FOLKER nun auch direkt die JSON-Formate importieren, die von Whisper und von Amberscript geschrieben werden.