masahif: 2019-05-12

Donnerstag, 16. Mai 2019

Unicode – graphisch oder logisch (small meems)

Bei den Zeichen der arabischen Schrift ist Unicode pragmatisch, nicht systematisch. Man benennt die Zeichen zwar nach ihrer Funktion bzw. ihrer Abstammung (also ein Zeichen als Modifikation eines anderen Zeichen, das aber nicht nach seiner Gestalt, sondern nach seinem Laut-Wert oder seiner Funktion benannt ist),
nimmt aber Zeichen nicht nach ihrer grammatischen Funktion auf,
sondern nach ihrer Gestalt;
man arbeitet gewissermaßen für Setzer, nicht für Sprachwissenschaftler.
Ich will das an einer Kritik Tom Milos an Unicode klarmachen.
Thomas Milo ist Setzer und Arabist; seine Kritik ist die des Arabisten.
Vier Zeilen aus seiner Unicode-Form des Nachwort des Gizeh-Drucks von 1924:

Es geht hier um das kleine Mīm, das es – wie man in der letzten Zeile deutlich sehen kann – in drei Höhen gibt.
(Ich habe am rechten Rand diese drei Zeichen wiederholt.)
Milo kritisiert Unicode aber nicht dafür. dass sie das mittlere übersehen haben, sondern dafür dass sie es zweifach kodiert haben, obwohl beide identisch seien.
Milo meint, da beide "nûn wird mîm gesprochen (iqlāb)" bedeuten, seien sie identisch und dürften nur einen Code-Wert haben.
Ich sehe es anders. Und auch ich setze dabei den Setzer-Hut und den Arabisten-Hut auf.
Ich fordere vier Zeichen,
Und nur eines der kodierten Zeichen ist richtig.
Die beiden letzten Zeichen in der letzten Zeile sind hohes kleines mīm über nûn sâkin (einmal am Wortende, einmal im Wort):
Dies ist das eigentliche iqlāb-Zeichen, es ist immer über dem nûn, ob ein bisschen höher oder tiefer, ist ohne Belang.
Die anderen drei Zeichen sind tanwīn-Zeichen und müssen deshalb – anlog zu dem gestapelten und den aufeinanderfolgenden tanwīn – dreifach kodiert werden: -am, -um, -im!
Wie alle tanwīns sitzen -am und -um über dem Buchstaben, -im darunter. Und wenn ein Buchstabe tiefer endet (wie das Grundlinien-Hamza in der letzten Zeile), dann kann -am bzw. -um tiefer sitzen als über ṭā, ẓā, lām.
Die Annahme von Unicode, dass man fatḥa+iqlāb verwenden soll statt -am, führt dazu, dass ein elektronischer muṣḥaf zuviele fatḥas enthält und zuwenig tanwīns.
Auch ich argumentiere pragmatisch.
Möglichst soll alles graphisch stimmen und grammatisch.
n → m , -am, -um, -im sehen unterschiedlich aus und haben unterschiedliche Funktion,
wandeln aber alle vokalloses nûn vor bāʾ in mîm, sei es ein nûn im Wort, sei es in einer Kasusendung.
Davon zu unterscheiden ist das ebenfalls oben sitzende isolierte Mîm (das Unicode "Initial Meem" nennt), das eine obligatorische Pause anzeigt (lāzim).
Und jetzt will ich, dass Sie noch mal genau hinsehen:
Am linken Rand gibt es zwei Mal (fast) das gleiche: ḍamma und Klein-Mīm,
aber die zwei Zeichen stehen in der dritten Zeile näher zusammen, sie sind EIN Zeichen, nämlich -um (iqlāb-ḍammatain).
Die zwei Zeichen in der letzten Zeile stehen weiter auseinander, sie gehören nicht zusammen,
sondern das ḍamma gehört zu dem Konsonanten über dem es steht, dem mīm,
und das Klein-mīm gehört zu dem Konsonanten über dem es geht, dem vokalzeichenlosen nûn.
‒

masahif

blogs

Seiten

Donnerstag, 16. Mai 2019

Unicode – graphisch oder logisch (small meems)

iẓhār nūn ii

schreib mir!

Missbrauch melden