Sprache trifft Technologie
Wie die Computer langsam sprechen lern(t)en
Neulich durfte ich an der Tagung «Logopädie im digitalen Wandel» meinen Vortrag Sprache trifft Technologie halten. Und wie der Titel schon andeutet: es ging um das spannende Zusammenspiel zwischen Sprache und Künstlicher Intelligenz – und um die vielen kleinen Schritte, die uns in den letzten Jahrzehnten dorthin gebracht haben, wo wir heute stehen.
Vom Babelfisch zur Realität
Meine eigene Faszination wurde noch verstärkt, als ich irgendwann um die Jahrtausendwende den Hitchhiker’s Guide to the Galaxy las. Darin gibt es den legendären Babelfisch: ein kleines Wesen, das man sich ins Ohr steckt, und plötzlich versteht man alle Sprachen. Damals reine Science-Fiction. Heute? Tja – wir sind näher dran, als man denken könnte. Die ersten Echtzeit-Übersetzungstools für über 100 Sprachen gibt es bereits. Perfekt sind sie noch nicht, aber die Richtung stimmt.
50 Jahre KI-Sprachentwicklung in Kurzform
Wenn man auf die letzten Jahrzehnte zurückschaut, sieht man eindrücklich, wie sich Technologie entwickelt hat:
- Text-to-Speech: Von den krächzenden Metallstimmen à la Stephen Hawking zu fast schon natürlichen KI-Stimmen.
- Automatic Speech Recognition (ASR): Vom mühsamen Diktat zu Transkriptionen, die heute fast in Echtzeit funktionieren.
- Maschinelle Übersetzungen: Von den ersten, manchmal skurrilen Google-Translate-Ausgaben zu Tools wie DeepL, die erstaunlich perfekte Übersetzungen liefern.
- Large Language Models (LLMs): Der Quantensprung, der uns Chatbots wie ChatGPT und Custom GPTs beschert hat.
Diese Fortschritte wurden möglich, weil wir heute über unglaubliche Rechenleistung und gigantische Datenmengen verfügen. Die KI lernt nicht nach festen Regeln („wenn A, dann B“), sondern anhand von Wahrscheinlichkeiten.
Und was bedeutet das für die Logopädie?
Hier wird es richtig spannend — und auch ein bisschen herausfordernd. Künstliche Intelligenz kann beispielsweise schon heute:
- bei der Dokumentation helfen (Berichte automatisch strukturieren und formulieren)
- kleine Übungstools unterstützen, z.B. bei Wortschatz oder Lautdifferenzierungen.
Ich habe selbst erste Tests gemacht: Ein Custom GPT, das Kindern beim Üben von Minimalpaaren wie Schal – Saal hilft. Klingt einfach — ist es aber nicht. Mal klappt es, mal versteht die KI meine Anweisungen überhaupt nicht. Ein anderes Mal läuft der Dialog fast schon erstaunlich flüssig. Warum? Tja, manchmal weiss es selbst die KI nicht so genau.
Besonders knifflig wird es, wenn man nur mit einzelnen Wörter antwortet. Sehr knappe Antworten machen den Chatbots noch Mühe. Und die KI versteht sehr wahrscheinlich Kindersprache auch nicht zuverlässig. Da ist also noch viel Luft nach oben.
Ein Blick nach vorne
Die Entwicklung steht natürlich nicht still: Schnellere Chips, lokale KI-Modelle – die auch den Datenschutzproblemen helfen könnten, aber die Standardmodelle nicht weiterentwickeln lassen werden; es braucht mehr öffentlich zugängliche (Trainings-)Daten! –, humanoide Roboter mit KI-Komponenten – vieles davon existiert bereits in den Labors. Die Frage bleibt: Wo wollen (und dürfen) wir diese Technologien einsetzen? Denn bei aller Faszination bleibt der Datenschutz eine echte Herausforderung. Immer wieder müssen wir abwägen: Welchen Preis bezahlen wir für welchen Mehrwert?
Fazit: Vielversprechend – aber mit Augenmass
KI bietet der Logopädie und der Sprachtherapie enorme Chancen. Aber sie ist kein Wundermittel. Und ganz ehrlich: Ein bisschen Geduld, Neugier und Experimentierfreude gehören dazu. Dann lässt sich ausprobieren, was heute schon geht – und was vielleicht erst morgen klappt.
Der Vortrag entstand für die Tagung «Logopädie im digitalen Wandel» (HfH Zürich).
👉 Mehr dazu und die Unterlagen gibt es hier: Sprache trifft Technologie