Erprobung eines Spracherkennungssystems
an der Schule für Körperbehinderte Ludwigshafen
Michael Huber, Monika Ullmann-Huber, Klaus Moosbrugger, Helmut Schäfer
Quelle: FIfF-Kommunikation, 13. Jahrgang, Heft 2.
An der Schule für Körperbehinderte Ludwigshafen haben sich im Verlauf des Schulversuchs "Erprobung eines Spracherkennungssystems an Sonderschulen" (ESSo) zwei Schwerpunkte herausgebildet:
- Einsatz der Spracherkennung als Tastaturersatz bei der Arbeit mit dem Computer (Textverarbeitung und andere Software wie Nachschlagewerke, Spiele, ...) sowohl im Unterricht als auch zu Hause,
- Einsatz der Spracherkennung zur Umfeldsteuerung und Erweiterung der spielerischen Möglichkeiten in der Freizeitgestaltung.
Zu Beginn unserer Arbeit mit Spracherkennung standen wir vor der Entscheidung, mit welchen Schülern wir während des Schulversuchs arbeiten sollten. Unsere Überlegungen richteten sich schnell auf Schüler, die entweder aufgrund ihrer cerebralen Bewegungsstörung erhebliche Probleme hatten, sich schriftsprachlich zu äußern oder aber aufgrund einer progredienten Erkrankung schon jetzt oder in absehbarer Zeit dazu nicht mehr in der Lage sein würden.
Fast alle der damals ausgewählten Schüler arbeiten noch heute erfolgreich mit der Spracherkennung; allerdings sind im Unterricht unterschiedliche Randbedingungen zu beobachten, die den Einsatz des Systems fördern oder behindern. Förderlich ist
- die Offenheit des Lehrers gegenüber dem Einsatz neuer Medien in der Klasse,
- die Wahl von freien Unterrichtsformen,
- das Vorhandensein von Personal und Zeit zum Trainieren des Systemeinsatzes mit dem Kind,
- eine hinreichend ruhige Umgebung für die Spracherkennung.
Bei wenigen Probanden wurde den Trainern allerdings sehr bald klar, dass die Schwere der Behinderung nur eine eingeschränkte Nutzung des Systems möglich macht. Dieser Abschlussbericht will vor allem die Suche nach alternativen Anwendungsformen an unserer Schule dokumentieren.
Ein Schüler
Beispielhaft für die Schüler, bei denen Spracherkennung nur in reduzierter Form angewendet werden kann, ist Anton, den wir hier näher beschreiben wollen:
Anton, geb.1986 hat eine cerebrale Bewegungsstörung mit athetotischer Ausprägung. Er besucht zur Zeit die 7. Klasse im Bildungsgang Hauptschule. Er ist ein guter, ehrgeiziger Schüler, den man leicht motivieren kann. Die vorhandene, stark ausgeprägte Dysarthrie macht Antons Aussprache sehr schwer verständlich. Die Sprache klingt stark gepresst und kehlig. Sie ist begleitet von diversen Geräuschen und Mitbewegungen. Entscheidend für Antons Probleme mit der Spracherkennung ist die Inkonstanz seiner Aussprache, die dem System eine eindeutige Erkennung erschwert. Nur ein sehr häufiges Training eines eingeschränkten Wortschatzes führte in der Anfangszeit der Erprobung zu mäßigem Erfolg. Die Bemühungen, ein Wort mehrmals hintereinander gleich auszusprechen, hatten die baldige Erschöpfung des Jungen zur Folge und brachten nur selten verwertbare Ergebnisse.
Bei einer öffentlichen Präsentation unserer Arbeit mit der Spracherkennung an unserer Schule wurde Anton dennoch gebeten, mittels weniger, kurzer Befehle diverse Geräte zu bedienen: Er schaltete Radio und Lampe an und aus, und brachte einen kleinen Helikopter zum Abheben. Die Tatsache, dass es sich bei den Ansteuererfordernissen um ein reduziertes Vokabular handelte, beeinflusste die Trefferquote beim Erkennen so günstig, dass Anton sichtlich Spaß daran fand, weiter mit Spracherkennung zu arbeiten, wenn auch nicht unbedingt im klassischen Einsatzgebiet Textverarbeitung.
Vielmehr konzentrierte sich das ESSo-Team der SfK Ludwigshafen auf die Suche nach Verwendungsmöglichkeiten im Bereich der Umfeldsteuerung, insbesondere beim Spiel.
Pädagogische Relevanz des selbstgesteuerten Spielens
Andreas Flitner hat bereits 1974 folgendes formuliert:
"Die pädagogische Bedeutung ... liegt in der wachsenden Einsicht, daß das freie und vielseitige Spielen für das Wohlbefinden des Kindes ebenso wie für seine Ausdrucksfähigkeit und sein kognitives und soziales Lernen eine Schlüsselstellung innehat und daß nicht nur im Vorschulalter, sondern in der [gesamten] Schulzeit die Anreicherung der Spielpraxis und die Förderung der Spielfähigkeit zu zentralen Aufgaben der Erziehung gehören. Die wichtigsten Entwicklungsaufgaben werden künftig wohl darin liegen: für die verschiedenen Altersstufen die Spielformen, die für eine günstige psychische, motorische, kognitive und soziale Entwicklung Kindes förderlich sind, genauer zu ermitteln; die Spielhemmungen und -ausfälle bei benachteiligten und behinderten Kindern kennen und überwinden zu lernen; eine Praxislehre im Vorfeld der Kindertherapie zu entwickeln, die für die Erzieher erlernbar ist; auch älteren Kindern - z. B. durch Erweiterung des Schulangebots - die Möglichkeit für Sozialspiele und für Ausdrucksspiele zu eröffnen und ihnen damit die Fähigkeit zum Umgang mit kleinen Kindern zu erhalten; überhaupt das Spielrepertoire der Kinder - ebenso wie das der Erzieher - systematisch zu erweitern; Spielbedingungen der Kinder durch Anlage und Ausstattung der Räume und Spielplätze zu verbessern und in der Öffentlichkeit die Bedeutung und die Bedingungen des Kinderspiels bewußter zu machen." (in "Wörterbuch der Erziehung" hrsg. v. Christoph Wulf, München 1974, S.555ff)
Die Schule für Körperbehinderte in Ludwigshafen ist als Ganztagsschule konzipiert. Daraus ergeben sich eine Reihe wichtiger Anforderungen hinsichtlich der erzieherischen und pädagogischen Aufgaben, was die Qualität und Struktur der Gestaltung des sogenannten Schullebens anbelangt. So wurden im letzten Schuljahr die Pausenzeiten entscheidend geändert und ausgedehnt; daraus ergab sich die Zielsetzung einer gestalteten Pause, d.h. eines erweiterten und auf die besonderen Bedürfnisse unserer Schüler zugeschnitten Angebots.
Aber nicht nur vor diesem Hintergrund wurde gerade der spielerischen Komponente einer Verwendung von Spracherkennung Rechnung getragen, sondern insbesondere ist die mittel- und langfristige selbstbestimmte Gestaltung der in ihrer Bedeutung immer stärker nach vorne drängenden Freizeit zu beachten. Ausgehend davon, dass schwer körperbehinderte Kinder mit enormen motorischen Einschränkungen nur wenig Möglichkeiten haben, sich spielerisch zu betätigen, überlegten wir, welche Hilfe die Spracherkennung bieten könnte, um diese Möglichkeiten zu erweitern.
Die Idee
Herr Moosbrugger, ein Mitglied des ESSo-Teams und begeisterter Modellflieger, hatte sehr bald die Idee, ein kleines Modellauto mittels Sprache zu steuern und realisierte zusammen mit seinem Vereinskollegen, Herrn Roth, einen ersten Prototypen. Dieser wurde in Zusammenarbeit mit der Fachhochschule Kaiserslautern im Rahmen von zwei Diplomarbeiten zu einem voll funktionsfähigen System ausgebaut.
Talk'n Drive: Aufgabenstellung und Lösungsskizze
Thema der Diplomarbeit (Diplomanden Christian Stilb und Jörg Fuchs, Fachbereich Elektrotechnik/Informationstechnik, Fachhochschule Kaiserslautern) war die Steuerung eines Modellautos mittels Sprache. Hierzu galt es folgende Teilprobleme zu lösen:
- Erstellung einer graphischen Benutzungsoberfläche auf dem PC, die den Blick aus dem Führerhaus des Modellautos (Funk-Videokamera am Fahrzeug) sowie die Visualisierung des Fahrzeug-Zustandes mit entsprechenden Instrumenten (Lenkrad, Tachometer, Vorwärts-/Rückwärts-Anzeige, Licht-Kontrollleuchte, Radio u.ä.) gestattet.
- Erfassung der mit der Software Dragon Dictate erkannten sprachlichen Befehle mit dem von Dragon bereitgestellten Application Programming Interface (API).
- Umsetzung der Befehle zur Ansteuerung einer Sende-Hardware über die parallele Schnittstelle des PCs.
- Analyse des Signalverlaufs einer handelsüblichen von Hand betriebenen Funkfernfernsteuerung.
- Entwicklung einer an der parallelen Schnittstelle des PCs betreibbaren Hardware zur Erzeugung des Fernsteuersignals.
Prinzipieller Aufbau:

Abbildung 1: Prinzipieller Aufbau des Systems
Bei der Lösung des Software-Teils der Arbeit wurde das Entwicklungssystem Delphi von Borland/Inprise genutzt. Die dabei entstandene Benutzungsoberfläche hat etwa folgenden Aufbau:

Abbildung 2: Aufbau der Benutzungsoberfläche
Der von der Video-Kamera erfaßte Blick aus dem Cockpit wird dabei im Rechteck "Kamerasignal" eingeblendet. Neben der graphischen Darstellung des Führerhauses leistet das entstandene Programm noch
- die Verwaltung der verschiedenen Benutzer mit ihren spezifischen Sprechereigenschaften und Fahrer-Fähigkeiten,
- die Speicherung der aktuellen Sender- und Fahrzeugeigenschaften (z.B. erlaubter Lenkradeinschlag, Servo-Nullpunkt u.ä.),
- die Ansteuerung der entwickelten Sender-Hardware über die parallele Schnittstelle,
- die Erfassung der von der Spracherkennung gemeldeten Befehle.
Die Hardware zur Modulation des Fernsteuerungssignals wurde unter Verwendung von Standard-TTL-Bausteinen entwickelt. Zum Einsatz kamen Zähler TTL 74191, Portbausteine 8243, Timer NE 555 sowie Logikbausteine PAL 22V10.
Im Blockschaltbild:

Abbildung 3: Blockschaltbild
Die Diplomarbeit wurde auf dem Gemeinschaftsstand der Hochschulen des Landes
Rheinland-Pfalz bei der CeBIT 1999 in Hannover präsentiert und fand lebhaftes Interesse bei den Messebesuchern.

Abbildung 4: Das fertige Modell 1999 auf der CeBIT
Einsatz des sprachgesteuerten Autos an der SfK Ludwigshafen
Das Auto steht einen Vormittag pro Woche in der Turnhalle zum Einsatz bereit. Mittlerweile hat sich ein fester Stamm von spielbegeisterten Schülern gebildet, der den Wagen regelmäßig zu Slalomfahrten und ähnlichen Geschicklichkeitsspielen nutzt. Da die auf dem Fahrzeug befindliche Kamera den Blick aus dem Führerhaus auf den Bildschirm des Steuerrechners überträgt, sind auch Fahrten außerhalb der Sicht des Schülers möglich. Dies macht "Erkundungsfahrten" für immobile Schüler besonders attraktiv.
Die Tatsache, dass der Befehlsumfang zur Steuerung des Fahrzeugs einen sehr kleinen Wortschatz darstellt (Vor, Rückwärts, Links, Rechts, Stop, Licht, Radio), bringt auch bei sehr schlechter Artikulation große Erfolge: Auch Schüler aus dem geistigbehinderten Bereich und/oder solche mit schwerer Dysarthrie können das Auto erfolgreich steuern.
Für viele dieser Kinder ist es das absolut erste Mal, selbständig ohne ständige Frustration ein solches Spielerlebnis zu erfahren.
ESSo = "Erprobung eines Spracherkennungssystems an Sonderschulen":
Modellversuch der Länder Rheinland-Pfalz und Mecklenburg-Vorpommern, gefördert durch das Bundesministerium für Bildung und Forschung
Das ESSo-Team der SfK Ludwigshafen
- R. Andreas (Pädagogische Fachkraft)
- K. Moosbrugger (Pädagogische Fachkraft)
- H. Schäfer (Sonderschullehrer)
- M. Ullmann-Huber (Sonderschullehrerin)
Diplomanden und Betreuer an der FH Kaiserslautern
- FB Elektrotechnik/Informationstechnik
- Dipl. Ing. (FH) Jörg Fuchs
- Dipl. Ing. (FH) Christian Stilb
- Prof. Dr. Michael Huber
Alle Rechte vorbehalten!
Quelle: FIfF-Kommunikation, 13. Jahrgang, Heft 2.
Die komplette Zeitschrift kann bei der FIfF-Geschäftsstelle bestellt werden.
Die Seiten werden redaktionell betreut von der FIfF-Regionalgruppe Bremen.
Hinweise und Anmerkungen bitte an Ralf E. Streibl.
Letzte Änderung: 03.07.2000