Von Wolfgang Hubert

Hinweis

Dieser Beitrag enthält Beispiele für Blindenkurzschrift. Diese Beispiele sind in der HTML-Version als 6-Punkt-Schrift visuell nur erkennbar, wenn die Schriftart "Blista Braille Plus (ANSI)" auf Ihrem Rechner installiert ist.

Bei der Lektüre via Braillezeile muss der Westeuropäische Zeichensatz eingestellt sein. Andernfalls werden einige Zeichen falsch dargestellt.

Betrachtungen zur Rückübersetzung der deutschen Blindenkurzschrift

Im Jahre 1825 hat Louis Braille seine 6-Punkt-Blindenschrift am königlichen Institut für junge Blinde in Paris vorgestellt. Seine geniale Erfindung wurde von Pädagogen und öffentlichen Ämtern zunächst skeptisch beurteilt. Sie war optisch schlecht lesbar, schien kompliziert zu handhaben und schwer zu erlernen. Außerdem stellte Sie die etablierten institutionellen Lehrmethoden in Frage, deren Grundlage erhabene Buchstaben bildeten. Sie erhöhte die Lesegeschwindigkeit gegenüber Reliefschrift jedoch beträchtlich, reichte aber in dieser Hinsicht noch nicht an die Schwarzschrift heran. Das war die Hauptmotivation zur späteren Ausarbeitung verschiedener nationaler Kurzschriften, von denen die deutsche im Jahre 1904 in Halle (Sachsen-Anhalt) verabschiedet wurde. Diese Blindenkurzschrift reduzierte den Umfang deutscher Texte um knapp ein Drittel, was sie zum weltweit effektivsten Brailleschriftsystem machte. Eine beeindruckende Leistung für die damalige Zeit, in der es noch keine Computer gab. Wer würde sich heute an die Entwicklung eines ähnlich effektiven Kompressionsalgorithmus heranwagen, bei dem alle Texte menschenlesbar bleiben sollen? Die Betonung liegt auf "menschenlesbar", denn es hat nach der Erfindung des Personal Computers in den späten 1970er Jahren noch rund 30 Jahre gedauert, bis mit RTFC eine praxistaugliche und qualitativ hochwertige Rückübersetzung auf den Markt kam. Doch warum hat es so lange gedauert? Was macht die Rückübersetzung so schwierig? Und wer braucht das überhaupt?

Nutzen der Rückübersetzung

Vor allem Geburtsblinde können mit der Brailleschrift eine Schreib- und Lesegeschwindigkeit erreichen, die der von Sehenden genutzten Schwarzschrift in nichts nachsteht. Eine Brailletastatur benötigt im Gegensatz zu einer PC-Tastatur nur 6 Tasten, um alle Zeichen schreiben zu können. Man könnte das Schreiben von Texten auf der Brailletastatur und der Computertastatur mit dem Unterschied zwischen einem Flötisten und einem Pianisten vergleichen. Der Pianist muss mit Armen und Händen arbeiten, um die Finger zu den richtigen Tasten zu bewegen. Der Flötist hat die Finger immer schon am richtigen Ort und muss nur eine oder mehrere Klappen zum richtigen Zeitpunkt niederdrücken. Auch wer auf einer Brailletastatur schreibt, hat die Finger immer schon am richtigen Ort. Was wirklich Übung braucht, ist das gleichzeitige Niederdrücken mehrerer Tasten. Diese kleine Unbequemlichkeit wird aber durch die Kurzschrift wettgemacht.

Der Autor erinnert sich noch lebhaft an seine blindentechnische Grundausbildung, wo er mit über 300 Anschlägen pro Minute auf der herkömmlichen Schreibmaschine als Sekretär prädestiniert war. Dennoch konnte er nicht mit einer blinden Lehrerin an der Nikolauspflege Stuttgart mithalten. Sie erreichte auf dem guten alten Perkins Brailler ein vergleichsweise höheres Tempo in Kurzschrift. Das Problem für den beruflichen Alltag ist nur, dass derart geschriebene Texte von Sehenden nicht unmittelbar gelesen werden können. Man könnte sogar sagen, dass Sehende durch die Verwendung der Blindenkurzschrift ausgegrenzt werden. Es geht hierbei nicht nur um das Lesen der Zeichen per Auge, sondern auch um das Beherrschen der derzeit 352 Kürzungen und des dazugehörigen Regelwerks. Blinde wären gezwungen, Texte für Sehende entweder direkt in 8-Punkt-Computerbraille einzugeben oder von Hand in Normalschrift zu übertragen. Beides ist langsamer als die direkte Kurzschrifteingabe mit Rückübersetzung.

Wir können also folgende Gründe für die Notwendigkeit einer automatisierten Rückübersetzung festhalten:

  1. In der inklusiven Beschulung blinder Schüler an Regelschulen ist die Rückübersetzung für die Kommunikation zwischen Lehrer und Schüler unbedingt notwendig. Wie sollten sehende Lehrer sonst in der Lage sein, Texte zu lesen, die von Blinden in Kurzschrift verfasst wurden? Dies gilt auch für den Hochschulbereich und andre Bildungseinrichtungen.
  2. In Szenarien, in denen blinde Mitarbeiter eines Unternehmens Protokolle, Konzepte, Anleitungen usw. verfassen müssen, ist die Rückübersetzung notwendig, um Texte für sehende Mitarbeiter aufzubereiten. Dies gilt insbesondere bei Mitschriften von Besprechungen oder Vorträgen, bei denen die Kurzschrift das Mitschreiben aufgrund der Zeitersparnis bei der Eingabe erst ermöglicht.
  3. In Systemen, die mit Sprachausgabe und Braille arbeiten, können Kurzschrift-Texte in normaler Sprache wiedergegeben werden. Es gibt zahlreiche Braillezeilen, Notizgeräte, Smartphones oder Screenreader, die hiervon profitieren können.
  4. Druckereien und Verlage, die im Blindenwesen tätig sind, verfügen oftmals über Archive von Texten in Blindenkurzschrift, da andere Textformen aus urheberrechtlichen Gründen problematisch sein können. Mit der Rückübersetzung können diese und andere Texte aus privaten Beständen wieder in Schwarzschrift gewandelt und weiterverarbeitet werden.

Dass eine automatisierte Rückübersetzung eine große Hilfe für alle Blinden in Studium und Beruf wäre, ist keine Frage - aber geht das überhaupt?

Problemstellung

Nicht alle Wörter und Sonderzeichen der Blindenkurzschrift sind zweifelsfrei rückübersetzbar. Während ein menschlicher Leser diese Zweifelsfälle aus dem Kontext heraus auflösen kann, hat der Computer in manchen Fällen ernste Schwierigkeiten. Der Programmieraufwand für eine 100%-Lösung erscheint bald größer und größer, wenn man sich intensiver mit der Materie auseinandersetzt. Die deutsche Blindenkurzschrift galt deshalb in Fachkreisen weithin als "nicht rückübersetzbar".

Vorüberlegungen

Machen wir uns zunächst ein paar Gedanken zur Übersetzung von Text nach Braille, denn dabei gewinnen wir wertvolle Erkenntnisse für die schwierigere Aufgabe der Rückübersetzung. Letztlich entscheidet sich die Rückübersetzbarkeit im Wesentlichen daran, ob und wie viele Wörter aus der Schwarzschrift zum gleichen Wortbild (Punktmuster) in Blindenschrift führen und somit nicht eindeutig sind.

Auf den ersten Blick sieht die Anwendung der Kürzungsregeln wie ein großer "Suchen und Ersetzen"-Algorithmus aus. Aber Vorsicht - die Tücke liegt im Detail. Denn dieser Vorgang muss in einer ganz bestimmten Reihenfolge durchgeführt werden. Eine zu frühe Anwendung von Lautgruppenkürzungen kann die Nutzung zweiformiger Kürzungen verhindern.

Beispiel:

Das Wort "ZUSAMMEN" (eigentlich gekürzt mit "zs") könnte auch mit "ZU", "MM" und "EN" gekürzt werden − oder vielleicht sogar mit "SAM"? Die Problematik liegt auf der Hand.

Nach der Reihenfolge der Anwendung kommt die Stellung im Wort. Manche Kürzungen dürfen nur am Wortanfang oder -ende, wieder andere nur im Wortinneren oder alleinstehend angewendet werden.

Beispiel:

Betrachten wir exemplarisch einmal das Zeichen "x" (Punkte 1, 3, 4, 6).

  • Am Wortanfang steht es für die Vorsilbe "EX-".
  • Im Wortinneren und am Wortende für "MM" oder die Endung "NIS".
  • Alleinstehend ist es die Kürzung für "IMMER".
  • Mit einem vorangestellten Punkt 2 steht es auch in Wörtern für "IMMER".
  • Mit einem vorangestellten Punkt 6 steht es schließlich für das, was es ist, nämlich der Buchstabe "x" − zumindest der Kleinbuchstabe. Für Großbuchstaben sind zusätzliche Großschreibzeichen notwendig.

Was dann noch bleibt, ist die Anwendung von Regeln zur Aussprache, der Sinnhaftigkeit, die Beachtung von Wortfugen, Präfixen und Suffixen und anderes mehr.

Haben wir das Problem der Übersetzung von Text nach Braille erschlagen, so besitzen wir eine wertvolle Grundlage für die eigentliche Aufgabe der Rückübersetzung. Durch die Kürzung kennen wir bereits alle Wortbilder und haben genug Material, um den Algorithmus für die Rückübersetzung zu testen.

Betrachten wir nun einige Schwierigkeiten der Rückübersetzung im Detail.

Mehrdeutigkeit von Kürzungen

Die meisten Kürzungen werden in Form einzelner Buchstaben oder Buchstabenkombinationen dargestellt, die in der Kurzschrift auch als normale Wortbestandteile auftreten. Sie bestehen nur selten aus eindeutig rückübersetzbaren Zeichen - etwa Zahlen oder Sonderzeichen, wie sie sonst in Wörtern nicht vorkommen.

Beispiele:

Die Endungen "UNG" und "HEIT" werden mit den einzelnen Buchstaben "u" und "h" dargestellt, und zwar sowohl am Ende eines Wortes als auch mitten im Wort. Eine typische Anwendung dieser Regel finden wir in Wörtern wie "Heizung" und "Heizungsmonteur" entsprechend "h3zu" und "h3zusmont2r" oder "Einheit" und "Einheiten" entsprechend "6h" und "6hc".

Demnach müsste das gekürzte Wort "kuh" (das Tier) bei der Rückübersetzung mit "Kungheit" wiedergegeben werden, was offensichtlich falsch ist.

Weiterhin gibt es zahlreiche zweiformige Kürzungen, wie etwa "zs" für "zusammen", die häufig als Wortbestandteil von Nomen oder Nomenkomposita auftreten. So darf "zs" bei Wortfugen wie in "Salzsäure" oder "Ersatzspur" nicht rückübersetzt werden.

Mehrdeutigkeit von Wörtern

Es gibt unterschiedliche Wörter, die nach der Kürzung zu gleichen Wortbildern (Punktmustern) führen. Diese Wörter können nur aus dem Kontext richtig interpretiert werden.

Beispiele:

  • Das Wort "möchten" und der chinesische Name "Chen" werden in Blindenkurzschrift beide als "4c" dargestellt.
  • Das Wort "Grabschrift" wird in Blindenkurzschrift als "grab5t" dargestellt, ebenso das Verb "grabscht" (von "grabschen"). Auch der Plural "Grabschriften" wird mit "grab5tc" identisch dargestellt wie das Verb "grabschten".
  • Das "Figurteil" wird ebenso wie das "Fertigurteil" als "f>urt3l" in Blindenschrift dargestellt.

Diese Aufzählung könnte noch fortgesetzt werden. Insbesondere bei Eigennamen, bei denen alle möglichen Zeichenfolgen jenseits linguistischer Regeln vorkommen können, sind solche Mehrdeutigkeiten zu finden.

Mehrdeutigkeit von Ankündigungszeichen

Da der Zeichenvorrat von 63 möglichen Punktkombinationen nicht zur Darstellung aller möglichen Textzeichen ausreicht, arbeitet die Blindenschrift mit Ankündigungszeichen, durch die nachfolgende Zeichen, Wörter oder Textpassagen eine andere Bedeutung erhalten. Es gibt Einschübe in Mathematikschrift, Computerbraille (zur Darstellung von Internet-Adressen und Dateinamen), Fremdsprachen und für ungekürzten Text. Diese Einschübe müssen erkannt und durch besondere Rückübersetzungsmodi in Normalschrift zurückgeführt werden.

Beispiele:

Das Wort "Tagesschau" wird mit "tag%51" übersetzt, die Internet-Adresse "tagesschau.de" dagegen als Einschub in Computerbraille mit "'$tagesschau.de". Der hierbei verwendete Apostroph (Punkt 6) kann in anderem Zusammenhang auch als Ankündigung für Kleinschreibung dienen, das Dollar-Zeichen (Punkte 4, 6) als Ankündigung für Großschreibung.

Fachbegriffe können in Blindenschrift zur besseren Lesbarkeit als Einschub in Vollschrift (weitgehend ungekürzt) dargestellt werden. Dann wird ihnen die Zeichenfolge "Apostroph-Punkt" vorangestellt wie in "'.desoxiribonukleins`ure".

Für fremdsprachliche Einschübe wird dasselbe Zeichen verwendet, das im Wortinneren oder am Wortende für die Kürzung "ACH" steht. Für die Großschreibung einzelner oder mehrerer Buchstaben im Wortinneren werden die gleichen Zeichen verwendet, die für die Kürzungen "CK" und "IG" stehen. In solchen Fällen dürfen dann keine Kürzungen innerhalb des Wortes verwendet werden.

Beispiele:

Das populäre Wort "iPhone" (in gemischter Groß-/Kleinschreibung) wird in Blindenschrift als "'i$phone"dargestellt. Wäre nicht der Punkt 6 am Anfang (hier steht er als Kleinschreibungspunkt), so könnte man das auch als "ICKPHONE" lesen. Was bedeutet aber "e$bank"? Ist das eine "eBank" für electronic Banking oder eine "Eckbank"?

Mehrdeutigkeit von Akzentbuchstaben

Akzentbuchstaben können in der deutschen Blindenschrift auf zweierlei Weise dargestellt werden: entweder in Umschrift oder mit den Braillezeichen aus der jeweiligen Sprache. In beiden Fällen wird ein Akzentbuchstabe mit einem vorangestellten Punkt 4 angekündigt (in der Schwarzschrift entspricht dieser einem Anführungszeichen).

Beispiel:

"Café Molière" kann entweder als "'caf"emoli"ere" oder als "'caf"% moli"~re" dargestellt werden. Selbst die letztgenannte Darstellungsform, die Hoffnungen auf eine eindeutige Rückübersetzbarkeit weckt, erweist sich als nicht hinreichend, da es bereits innerhalb der wenigen westeuropäischen Sprachen mehrfach verwendete Braillezeichen bei den Akzentbuchstaben gibt.

Mehrdeutigkeit von Sonderzeichen

Die deutsche Blindenschrift unterscheidet nicht zwischen sich öffnenden und schließenden Klammern, was die Zuordnung von Klammerpaaren erschwert.

Beispiele:

  • "(siehe unten)" wird übersetzt mit "=s0he /tc=".
  • "[Anmerkung des Verfassers]" wird übersetzt mit "'=+m7ku .-fa~7s'=".

Dazu kommen weitere Sonderzeichen, für die es in der Schwarzschrift mehrere unterschiedliche Zeichen gibt.

Beispiele:

  • Das Abtrennungszeichen, bestehend aus den Punkten 5 und 3, 6 kann je nach Kontext für einen senkrechten Strich, ein Aufzählungszeichen (Mittepunkt) oder ein Silbentrennzeichen usw. stehen.
  • Der Punkt 6 kann u. a. als Apostroph, als Ankündigungszeichen für Kleinschreibung oder als Aufhebungszeichen verwendet werden. Das Aufhebungszeichen gibt einem oder mehreren nachfolgenden Zeichen deren ursprüngliche Bedeutung zurück. Diese sind dann beispielsweise nicht mehr als Kürzung zu interpretieren.

Abhängigkeit von der Stellung im Wort

Wir haben bereits erwähnt, dass es Zeichen gibt, die abhängig von der Stellung im Wort für unterschiedliche Kürzungen stehen. Einige Zeichen können auch als Ankündigungs- oder Satzzeichen gelesen werden, was eine zusätzliche Hürde darstellt.

Beispiele:

Für die Zahlen 1 bis 9 und 0 werden die Buchstaben a bis j mit vorangestelltem ahlzeichen verwendet ("#a" bis "#i" und "#j"). Das Zahlzeichen kann jedoch innerhalb und am Ende von Wörtern auch für die Zeichenfolge "ICH" stehen. So wird das Wort "striche" als "}r#e" umgesetzt. Steht zusätzlich ein Komma vor dem Zahlzeichen, so steht es für "richt", etwa in "Gerichte" entsprechend "&,#e". "#e2 ist in diesen Fällen nicht als Zahl "5" zu lesen wie etwa bei "5fach" entsprechend "#e'f<".

Die Satzzeichen ",", ";", ":", "?" und "!" werden als Ankündigungszeichen oder zur Darstellung von Lautgruppen verwendet, wenn sie nicht am Ende eines Wortes stehen. So wird "analog!:" mit "+:og+:"übersetzt. "+:" ist am Wortanfang als Folge von Buchstaben, am Ende jedoch als Folge von Satzzeichen zu lesen.

Was ist die Lösung?

Die vorgenannten Schwierigkeiten verderben uns sozusagen die Suppe, weil sie nicht ohne weiteres in einen Algorithmus gefasst werden können. Das ist eine technologische Herausforderung. Benötigen wir hierfür ein großes Datenbanksystem, ein neuronales Netzwerk oder gar künstliche Intelligenz? Am Ende muss unser Programm möglichst schnell sein und in Notizgeräten laufen, die einen schwachen Prozessor und wenig Arbeitsspeicher haben.

Jede Lösung, die auf einem trainierten oder gespeicherten Wortschatz beruht, wäre auf eben diesen begrenzt. Ein algorithmischer Ansatz dagegen, der auf linguistischen Regeln basiert, hat das Potential, auch bei unbekannten Wörtern korrekte Ergebnisse zu liefern. Das ist der Ansatz, den RTFC verfolgt.

Verfügbarkeit der Rückübersetzung

Das RTFC Braille Modul ist als Dynamic Link Library (DLL) für Windows und als portabler C-Quellcode für die Implementierung in embedded Systems erhältlich.

Neben RTFC selbst haben bereits mehrere Firmen das RTFC Braille Modul in ihre Programme oder Geräte integriert. Während RTFC die Rückübersetzung von Dateien und Tastatureingaben unter Windows ermöglicht, bieten mittlerweile zahlreiche Braillezeilen, Notizgeräte und Screenreader gleichartige Funktionen mithilfe des RTFC Braille Moduls an. Dazu zählen Geräte von Help Tech (Deutschland), Humanware (Kanada) und Selvas (Korea), sowie die Screenreader JAWS und VoiceOver.

Zum Autor

Der Autor ist Ingenieur der Informatik und wurde 1987 mit dem Preis der Fördergesellschaft der FH Furtwangen bedacht. Er beschäftigt sich seit 1997 mit der maschinellen Übertragung von Blindenschrift. Er mag Erdbeeren mit Rahm und musiziert gerne auf der Querflöte.

Bild: Dipl.-Ing. (FH) Wolfgang Hubert lächelt. Er trägt zu seinem braunen Haarkranz einen gepflegten Vollbart und eine Brille mit Metallbügel. Foto: W. Hubert

Wonach suchen Sie?