[wilhelmtux-discussion] Umlaute [war: Re: offene standards]

Dietrich Feist dietrich.feist at mw.iap.unibe.ch
Don Jan 16 18:11:54 CET 2003


Hallo Manfred,

> Ein deutsches OE auf einem deutschen Windows sendet ein "ä" in einer
> HTML-Email als "ä". Damit kann natürlich niemand etwas anfangen. Ein 
> englisches OE auf einem englischen Windows, sendet ein "ä" als 
> "ä", was HTML-Anzeigemodule richtig interpretieren können wenn 
> sie den Zeichensatz richtig auswählen und (Voraussetzung) überhaupt 
> ein geeigneter Zeichensatz verfügbar ist.

Verstehe ich nicht. Wenn es in diesem Fall Probleme gibt, dann liegt das
ausschliesslich an fehlerhaft arbeitenden Applikationen. In einer
HTML-Mail muss im Header der Mime-Type und damit der Zeichensatz
angegeben sein. Wenn das der Fall ist, sollte es auch keine Probleme mit
der Darstellung beim Empfänger geben - es sei denn er hat keinen Font zu
diesem Zeichensatz. Aber in dem Fall hilft ihm auch "ä" nicht
weiter.

Auch bei reinen Textmails sollte im Mailheader der Zeichensatz der
Nachricht angegeben sein. Dann gibt es keine nachvollziehbaren Probleme
mit "ä". Its nichts angegeben, dann gilt US-ASCII als Default. Dann sind
aber sowieso nur 7-Bit-Zeichen erlaubt. Umlaute im Header, z.B. im
Subject machen grundsätzlich Probleme, weil im SMTP-Standard keine
Angabe des Zeichensatzes für Headerangaben vorgesehen ist. Da gilt immer
US-ASCII mit 7 Bit.

Ansonsten definiert der HTML-Standard klipp und klar, wie man
Zeichensätze für HTML-Dokumente angeben muss. Und wenn man das nicht
tut, dann ist der Defaultwert nicht US-ASCII, sondern ISO-8859-1 für
HTML 2.0 und ISO/IEC 10646 (alias Unicode) für HTML 4.0 [1]! Mit einem
"ä" solltest Du also in keinem Fall Probleme haben, denn Unicode ist
eine Obermenge von ISO-8859-1. Wenn es doch Probleme gibt, liegt es
nicht an der Standarddefinition.

Viele Grüsse,

Dietrich

[1] http://www.w3.org/International/O-HTML-charset.html