Donnerstag, 16. Mai 2019

Unicode – graphisch oder logisch (small meems)

Bei den Zeichen der arabischen Schrift ist Unicode prag­matisch, nicht syste­matisch. Man benennt die Zeichen zwar nach ihrer Funktion bzw. ihrer Abstam­mung (also ein Zeichen als Modi­fikation eines anderen Zeichen, das aber nicht nach seiner Gestalt, sondern nach seinem Laut-Wert oder seiner Funk­tion benannt ist),
nimmt aber Zeichen nicht nach ihrer gramma­tischen Funk­tion auf,
sondern nach ihrer Gestalt;
man arbeitet gewisser­maßen für Setzer, nicht für Sprach­wissen­schaftler.
Ich will das an einer Kritik Tom Milos an Unicode klarmachen.
Thomas Milo ist Setzer und Arabist; seine Kritik ist die des Arabisten.
Vier Zeilen aus seiner Unicode-Form des Nach­wort des Gizeh-Drucks von 1924:


Es geht hier um das kleine Mīm, das es – wie man in der letzten Zeile deut­lich sehen kann – in drei Höhen gibt.
(Ich habe am rechten Rand diese drei Zeichen wieder­holt.)
Milo kritisiert Unicode aber nicht dafür. dass sie das mitt­lere über­sehen haben, sondern dafür dass sie es zweifach kodiert haben, obwohl beide identisch seien.
Milo meint, da beide "nûn wird mîm gesprochen (iqlāb)" bedeuten, seien sie identisch und dürften nur einen Code-Wert haben.
Ich sehe es anders. Und auch ich setze dabei den Setzer-Hut und den Arabisten-Hut auf.
Ich fordere vier Zeichen,
Und nur eines der kodierten Zeichen ist richtig.
Die beiden letzten Zeichen in der letzten Zeile sind hohes kleines mīm über nûn sâkin (einmal am Wort­ende, einmal im Wort):
Dies ist das eigentliche iqlāb-Zeichen, es ist immer über dem nûn, ob ein bisschen höher oder tiefer, ist ohne Belang.
Die anderen drei Zeichen sind tanwīn-Zeichen und müssen des­halb – anlog zu dem gesta­pelten und den auf­einander­folgenden tan­wīn – dreifach kodiert werden: -am, -um, -im!
Wie alle tanwīns sitzen -am und -um über dem Buch­staben, -im darunter. Und wenn ein Buch­stabe tiefer endet (wie das Grund­linien-Hamza in der letzten Zeile), dann kann -am bzw. -um tiefer sitzen als über ṭā, ẓā, lām.
Die Annahme von Unicode, dass man fatḥa+iqlāb ver­wenden soll statt -am, führt dazu, dass ein elektro­nischer muṣḥaf zuviele fatḥas ent­hält und zu­wenig tanwīns.
Auch ich argumentiere pragmatisch.
Möglichst soll alles graphisch stimmen und grammatisch.
n → m , -am, -um, -im sehen unter­schiedlich aus und haben unter­schiedliche Funktion,
wandeln aber alle vokal­loses nûn vor bāʾ in mîm, sei es ein nûn im Wort, sei es in einer Kasus­endung.
Davon zu unter­scheiden ist das ebenfalls oben sitzende isolierte Mîm (das Unicode "Initial Meem" nennt), das eine obliga­torische Pause anzeigt (lāzim).
Und jetzt will ich, dass Sie noch mal genau hinsehen:
Am linken Rand gibt es zwei Mal (fast) das gleiche: ḍamma und Klein-Mīm,
aber die zwei Zeichen stehen in der dritten Zeile näher zusammen, sie sind EIN Zeichen, nämlich -um (iqlāb-ḍamma­tain).
Die zwei Zeichen in der letzten Zeile stehen weiter aus­einan­der, sie gehören nicht zusam­men,
sondern das ḍamma gehört zu dem Kon­sonanten über dem es steht, dem mīm,
und das Klein-mīm gehört zu dem Kon­sonanten über dem es geht, dem vokal­zeichen­losen nûn.

Iran VI (1886)