[wilhelmtux-discussion] Umlaute [war: Re: offene standards]

Dietrich Feist dietrich.feist at mw.iap.unibe.ch
Fre Jan 17 15:01:45 CET 2003


Hallo Theo,

zunächst mal kommt Deine Mail hier so an:

> X-MIME-Autoconverted: from quoted-printable to 8bit by
> kalinka.catatec.ch id h0HBxSEb025276
> Content-type: text/plain; charset=iso-8859-1; format=flowed
> Content-transfer-encoding: 8BIT

Kein Problem mit Deinen Umlauten!

> Wilhelmtux-Digest mit *korrekten* Umlauten, mein eigenes auch, aber 
> das von Dietrich mit *falschen* Umlauten. Das Mail von Manfred hat im 
> Header:
> 
> Content-Type: text/plain
> Content-Transfer-Encoding: 8bit, mein eigenes hat:
> 
> Content-Type: text/plain ; format="flowed"
> Content-Transfer-Encoding: 8bit, das von Dietrich hat:
> 
> Content-type: text/plain; charset=iso-8859-15
> Content-transfer-encoding: 8BIT
> 
> Also ist es gerade falsch, den Zeichsatz anzugeben, ausser er sei 
> US-ASCII?

Nein, das Problem ist möglicherweise, dass Du die Mails als Digest liest
und als Format Plaintext angegeben hast. Da können Umlaute nicht mehr
korrekt angegeben werden, weil ja Mails mit verschiedenen Kodierungen in
einer einzigen Mail übertragen werden. Falls Du doch MIME eingeschaltet
hast, ist das entweder ein Bug bei Mailman (unwahrscheinlich) oder das
Problem, dass Dein Eudora ISO-8859-15 (= ISO-8859-1 mit Euro-Symbol)
nicht kennt. Das gibt es leider öfter. Ich habe jetzt wieder auf
ISO-8859-1 zurückgeschaltet, das war nicht mit Absicht so eingestellt. 

Was man aber auch sieht, ist, dass mein Mailprogramm (Netscape) als
einziges den Zeichensatz wirklich korrekt angegeben hat. Mit einer
Angabe wie "(bit" allein kann niemand was anfangen. Mein Mailprogramm
hat auch praktisch nie Probleme damit, die Umlaute anderer Leute richtig
darzustellen. Anscheined ist Netscape einer der wenigen Mailer, der sich
an die MIME-Spezifikationen hält.

> Was ist nun die Standarddefinition für HTML 3 und 4: Kodierungen wie 
> "ä" oder Unicode? Und "beissen" sich nicht die zwei Methoden? 
> Und wenn eines der Methoden der offizielle Standard ist, ist es 
> gerade die andere Methode, die Usus ist? Und was hat das für 
> Konsequenzen für die Diskussion um offene Formate?

Es war bei HTML schon immer korrekt, ein "ä" ("ae") zu schreiben. Jeder
Browser seit Mosaic hätte das korrekt darstellen müssen. Die Form
"ä" etc. ist nicht als Vorschrift für Umlaute gedacht, sondern für
Leute, die diese Umlaute nicht auf Ihrer Tastatur haben! Und auch in
Unicode kannst Du alle Zeichen aus ISO-8859-1 verwenden: die Kodierung
ist bei diesen identisch.

Die Konsequenz für offene Formate ist, dass fehlerhafte Darstellung auf
Programmfehler oder Schlamperei zurückzuführen sind und nicht auf
Probleme der Standards. Bei einer kommerziellen Software sollte man sich
beim Hersteller beschweren. Freie Software sollte diese Standards
selbstverständlich korrekt und vollständig implementieren.

Viele Grüsse,

Dietrich