[wilhelmtux-discussion] (2) Umlaute [war: Re: offene standards]

Sam Jan 18 19:33:21 CET 2003

Hallo Liste,

Wenn ich die Diskussion so betrachte zwingt sich eine Erkenntnis ganz 
deutlich auf: Wirklich relevante Daten soltlen im 7BIT-ASCII-Zeichensatz 
gespeichert werden oder in UTF8.

Alles andere hat keinen Sinn. Die Email mit den Umlauten, die auf 
verschienene Browsern verschieden zu erkennen waren ist praktisch der Beweis 
dafür, dass es nur so geht.

Noch ein letzter Nachtrag dazu.

Ich glaube schon, dass die Angabe, dass "ä" (also ae) nur dann als "&auml;" 
gespeichert wird, wenn das Tastaturlayout keine "Ae-Taste enth&auml;lt.

Aber das kann doch wohl nicht der Ernst sein? Das bedeutet ja, dass ich mit 
HTML-Dateien immer nur in einer Sprache kommunizieren kann, oder?

Ich denke, an dieser Stelle wird es schon zu kompliziert um es korrekt zu 
managen. Man sieht ja, dass es bereits heute zu schwierig ist, solche Angaben 
wie "ISO8859-1" tatsächlich richtig zu interpretieren.

Selbst wenn es heute wunderbar funktioneiren würde, ist das noch kein 
ausreichendr Beweis, dass die internationalen Zeichensätzt wirklich später 
noch brauchbar sind.

Ein allerletztes Beispiel:

Das EURO ( ) -Symbol. Es macht aus einem 1-Byte-Alphabet plötzlich ein 
Unicode-Alphabet. Mit der Verwendung dieses Zeichens statt dem Kürzel "EU" 
oder "Eu" oder dem Wort "Euro", beginnen bereits massive Probleme bei der 
Datenhaltung. Das Alphabet  de_DE mag da noch ganz nützlich sein, aber was 
ist mit de_CH? Und was ist, wenn solche Dokumente mit ausländischen (z.B. 
koreanischen, ägyptischen, peruanischen) Partnern ausgetauscht werden sollen? 
Was ist, wenn Software, die früher "DM", "CHF" usw, kannte, plötzlich auf ein 
Unicode-Zeichen stösst?

Nur so ein Gedankenanstoss.

Viele Grüsse,
Manfred.