[wilhelmtux-discussion] (2) Umlaute [war: Re: offene standards]
Manfred Morgner
manfred.morgner at gmx.net
Sam Jan 18 19:33:21 CET 2003
Hallo Liste,
Wenn ich die Diskussion so betrachte zwingt sich eine Erkenntnis ganz
deutlich auf: Wirklich relevante Daten soltlen im 7BIT-ASCII-Zeichensatz
gespeichert werden oder in UTF8.
Alles andere hat keinen Sinn. Die Email mit den Umlauten, die auf
verschienene Browsern verschieden zu erkennen waren ist praktisch der Beweis
dafür, dass es nur so geht.
Noch ein letzter Nachtrag dazu.
Ich glaube schon, dass die Angabe, dass "ä" (also ae) nur dann als "ä"
gespeichert wird, wenn das Tastaturlayout keine "Ae-Taste enthält.
Aber das kann doch wohl nicht der Ernst sein? Das bedeutet ja, dass ich mit
HTML-Dateien immer nur in einer Sprache kommunizieren kann, oder?
Ich denke, an dieser Stelle wird es schon zu kompliziert um es korrekt zu
managen. Man sieht ja, dass es bereits heute zu schwierig ist, solche Angaben
wie "ISO8859-1" tatsächlich richtig zu interpretieren.
Selbst wenn es heute wunderbar funktioneiren würde, ist das noch kein
ausreichendr Beweis, dass die internationalen Zeichensätzt wirklich später
noch brauchbar sind.
Ein allerletztes Beispiel:
Das EURO ( ) -Symbol. Es macht aus einem 1-Byte-Alphabet plötzlich ein
Unicode-Alphabet. Mit der Verwendung dieses Zeichens statt dem Kürzel "EU"
oder "Eu" oder dem Wort "Euro", beginnen bereits massive Probleme bei der
Datenhaltung. Das Alphabet de_DE mag da noch ganz nützlich sein, aber was
ist mit de_CH? Und was ist, wenn solche Dokumente mit ausländischen (z.B.
koreanischen, ägyptischen, peruanischen) Partnern ausgetauscht werden sollen?
Was ist, wenn Software, die früher "DM", "CHF" usw, kannte, plötzlich auf ein
Unicode-Zeichen stösst?
Nur so ein Gedankenanstoss.
Viele Grüsse,
Manfred.