[wilhelmtux-discussion] offene standards

Dietrich Feist dietrich.feist at mw.iap.unibe.ch
Mit Jan 15 13:48:21 CET 2003


Hallo Manfred,

> (1) Es muss einfach sein, das Format zu interpretieren ohne die 
> Definition zu kennen. Das Format sollte also auf ASCII-Zeichen beruhen 
> und durch Menschen lesbar sein. Denn wir wissen nicht, welche Technik 
> zukünftig verwendet werden wird.

In den meisten Punkten stimme ich Dir zu, aber in diesem einen nicht.
Auch ASCII-Dateien sind letztendlich Binärdateien, die Zahlen enthalten.
Wenn man die Zuordnung der Zeichen zu diesen Zahlen nicht kennt, kann
man in späteren Zeiten auch ein ASCII-Dokument nicht mehr lesen. 

Ausserdem ist ASCII ein ziemlich alter Standard, der ausser dem
Englischen keiner Sprache wirklich gerecht wird. Schon für die
europäischen Sprachen braucht man Erweiterungen, die letztendlich wieder
irgendwo im Dokument angegeben werden müssen. Und mehr als die Hälfte
der Weltbevölkerung kann mit den begrenzten Möglichkeiten des
ASCII-Zeichensatzes überhaupt keine lesbaren Dokumente erstellen. Von
daher muss jeder zukünftige Dokumentstandard auf jeden Fall beliebig
viele und beliebig grosse Alphabete unterstützen.

Man müsste vielleicht mal in eine andere Richtung schauen: in den 70er
Jahren haben sich viele hervorragende Wissenschaftler wie Carl Sagan
oder Freeman Dyson mit der Frage beschäftigt, wie man mit
ausserirdischen Zivilisationen Kontakt aufnehmen könnte. Da ging es
unter anderem um Möglichkeiten, in einer Nachricht Metainformationen für
die Dekodierung unterzubringen. Diese erlauben es dem Empfänger, die
Nachricht zu verstehen, auch wenn es keinen vereinbarten Standard gibt.
Sagan hat diese Ideen auch in seinem Roman "Contact" verwendet. Für
langfristige Datenspeicherung wäre das eine tolle Sache, denn dann würde
jedes Dokument bereits die Informationen für seine eigene Dekodierung
enthalten. So ist das z.B. auch beim menschlichen (oder anderen) Erbgut
geregelt: die DNS produziert selbst die Proteine, mit der ihre
Informationen gelesen werden können. Leider ist das nicht unbedingt mit
dem Anspruch auf Einfachheit vereinbar. Wie man in dem völlig genialen
Buch "Gödel, Escher, Bach" von Douglas R. Hofstadter nachlesen kann,
bedingen solche selbstbezüglichen Metainformationen ein hohes Mass an
Komplexität.

Bei den heutige Datenformate sind in der Regel sehr viele Kompromisse
eingegangen worden, um Speicherplatz zu sparen. Das wird in der Zukunft
immer unwichtiger werden. Wenn man sich mal von diesen Vorgaben befreit,
könnte man mal über ein wirklich zukunftsweisendes Format nachdenken.

So, ich hoffe, das klang jetzt nicht zu utopisch!

Viele Grüsse,

Dietrich