Freitag, 28. Dezember 2018

Unicode ‒ tanwīn

Unicode ist ein Consor­tium von Micro­soft, Xerox, Apple, Adobe und anderen. Es gibt einen Standard für alle möglichen Zeichen in der elek­troni­schen Daten­ver­arbei­tung heraus.
Der Standard wird mit der Interna­tional Standard Organi­sation in Genf ab­gestimmt.
Von Anfang an waren nicht nur die arabi­schen Zeichen, die für Zeitungen und gewöhn­liche Bücher nötig waren, sondern auch die meisten für den Gizeh-Koran er­forder­lichen kodiert.
Auf Betreiben von Pakistanis und Iranern sind inzwischen ein paar Zeichen dazu­gekommen.
Obwohl die ägyptische Firma Harf 1996 und seit­her mehrere tür­kische Firmen Fonts her­stel­len, welche die in der Türkei erforder­lichen Zeichen ent­hal­ten, sind diese nicht in Uni­code kodiert, von in Afrika verwen­deten Zeichen zu schwei­gen.
Türkische, marokkanische, maureta­nische, senega­lesische Firmen bedienen sich des­halb mit Bil­dern oder mit eigen­mächtig beleg­ten Zeichen (propriätere Lösungen).
Doch als erstes will ich mich nicht mit den fehlen­den afrika­nischen und türki­schen Zeichen be­fassen (die teils auch sonst ver­wendet werden),
sondern mit den tanwīn-Zeichen, die irgendwie da sind.

Zwei Vorbemerkungen:
Zu unterscheiden ist die Eingabe (über Tastatur), die Kodie­rung (im Daten­strom) und die Aus­gabe (vom Drucker).
Genau genommen kümmert sich Uni­code nur um die Zeichen­kodie­rung.
In der Praxis wirkt das jedoch sowohl auf die Ein­gabe, wie auf das Rendering.
Es gilt festzu­stellen, dass Unicode Zeichen grund­sätz­lich nach ihrem seman­ti­schen Wert – nicht nach ihrer Ge­stalt – definiert:
also ARABIC SIGN TAKHAL­LUS nicht „Small Initial-Sīn above“, ARABIC LET­TER KASHMIRI YEH nicht „Yeh with small 5 be­low“.
Entsprechend gab es von Anfang an ARABIC FATHATAN, DAMMATAN bzw. KASRATAN und nicht „Two Fatha-Strokes above“, „Two Damma above“ bzw. „Two Kasra-Strokes below“.
Nun gibt es aber in Mag und Q24 jedes der drei Zeichen (die fatḥa+nūn, ḍamma+nūn, kasra+nūn, also /an/, /un/, /in/ sind) in drei Varian­ten, je nach­dem vor welchen Buch­staben sie stehen. Da hier strenge Regeln gelten, muss man die Varian­ten nicht gra­phisch dif­feren­zieren (und Türken, Perser, Inder und Indo­nesier tun dies auch nicht), aber Magh­rebiner und moderne Araber tun es.

Obwohl Unicode im allgemeinen Q52 wieder­gibt, gab es anfangs nur die „normale“ Variante, später kamen OPEN FATHA­TAN, OPEN DAMMA­TAN und OPEN KASRA­TAN hinzu, womit, immer noch die dritte graphi­sche Vari­ante fehlt: Iqlāb (Austausch von nūn durch mīm); der Uni­code work around, dass man fatḥa + small mīm, ḍamma + small mīm bzw. kasra + small mīm below nimmt, ist un­logisch, da es sich um fatḥa­tain plus Iqlāb (und nicht um fatḥa plus Iqlāb) han­delt.
Übrigens hatte sich der King Fahd Glorius Quran Printing Complex (dt. KFK) mindestens zweimal an Unicode gewandt mit der Bitte, den sau­blöden Namen OPEN durch "Successive" zu ersetzen, weil sie auf Arabisch تتابع heißen und DER ein­deutige Unter­schied zum normalen (ge­stapel­ten, über-ein-andere-en) das Nach-Einander ist. Ohne je einen Grund zu geben, blieben die Herren bei ihrem ver­rückten Namen. Dass die Saʿudis auch noch eine gra­phi­sche Änderung woll­ten ‒ dass bei SUC­CES­SIVE FATHA­TAN der zweite (linke) Strich über dem ersten ansetzt ‒, haben sie nicht an­ge­nommen, was kein Problem ist, da das Bild in Uni­code offi­ziell nur ein Bei­spiel, nur eine mögliche Reali­sation des Zei­chens/char ist. (Dass manche Font­ge­stalter das nicht recht wissen und das von Uni­code ver­öffent­liche Bild treu-doof nach­ahmen, braucht sie nicht zu bekümmern.)
Oben so wie der KFK es all die Jahre FALSCH ge­schrieben hat. Unten wie es heute allein richtig ist.
Nochmals ganz langsam, für fatḥa­tan stell­ver­tretend auch für die andern bei­den gesagt:
anders als fatḥa und ge­rades/lan­ges fatḥa ist fatḥatan kein reines Laut­zeichen (a, ā), sondern ein Kasus- und Unbe­stimmt-Zeichen
in DEN DREI Gestalten gleicher­maßen.

Bei Indern Türken Persern wird es immer gleich geschrie­ben, obwohl es anders klingt
und in Bombay, Delhi, China und Indo­nesien gab es die Möglichkeit, das vor آ ع ح خ ه zu hörende nūn   extra zu markieren
‒ was zusammen mit dem "normalen" fatḥatan   dem Übereinander-fatḥatan in Afrika entspricht,
‒ wie NUR fatḥtan dem Nach-einander-Tanwīn in Afrika entspricht.
Es ist also falsch, wenn Unicode dekre­tiert, dass es nur zwei fatḥatain gebe, dass das dritte (das fatḥatain vor bāʾ) ein fatḥa plus klein-mīm sei.


Zwar hätte man auf die Kodierung von fatḥa­tain ganz ver­zich­ten können und bei der Eingabe und bei der Daten­speiche­rung
a) fatḥa + klein-nūn für das normale, bei der Aus­gabe ge­stapelte Zwei-Fathas und gestapelte fatḥa­tain + klein-nūn anbie­ten können (je nach Tradition oder Gusto)
b) fatḥa + fatḥa für das offene, bei der Aus­gabe versetzt auf­einander­folgende und
c) fatḥa + klein-mīm (oben) für tamwim (das in Indien als fatḥa­tain plus klein-mīm ausge­geben wird) nehmen können.
Zwei Varian­ten mit extra Kodie­rungen und die dritte völlig falsch in den Daten­speicher schrei­ben zu müssen ‒ so, dass man in Texten nicht einfach nach Fatha­tain suchen kann und bei der Suche nach Fatha falsche Treffer hat ‒ das geht nicht. Übrigens gab es seit 2005 eine Gruppe von IT-Spezia­listen, die man hätte zu Rate ziehen können.
Leider blieb man unter sich
Und jemand, der sowohl was von Arabisch versteht als von ara­bi­scher Kalli­gra­phie, Thomas Milo, konnte nichts bewirken.
Vermutlich redete man zu oft anein­ander vorbei. Vermutlich (!) hätte Milo lieber eine Tiefen­struktur enkodiert, die die Unicodistas gar nicht verstanden.

Bei Chinesisch, Japanisch, Koranisch hat man prinzi‒piel gleiche, gleich bedeutende Zeichen EINmal kodiert und die unterschied­lichen Ausgabe erfolgt über "locale".
So hätte man auch EIN "feh"/fāʾ definieren können, das normaler­weise einen Punkte OBEN hat, beim "locale" "maghreb" einen Punkt darunter,
ein "noon"/nūn, das normalerweise immer einen Punkt darüber hat, bei "maghreb" aber in Iso- und End-Position keinen (weil dann die Form aussage­kräftig genug ist).
Man hat aber die Zeichen nach der Form uni-kodiert ‒ leider mit grotesken Auswüchsen, wie ich in "Kein Standard" dargelegt habe, und wohl auch irgendwann hier ausführen werden.

Keine Kommentare:

Kommentar veröffentlichen

Iran VI (1886)