[wilhelmtux-discussion] Re: PDF

Sascha Brawer brawer at dandelis.ch
Thu Nov 20 11:19:22 CET 2003


Theo Schmidt <tschmidt at mus.ch> schrieb:

>At 16:46 Uhr +0100 19.11.2003, Sascha Brawer wrote:
>>...Hm, es würde mich interessieren, warum Du PDF als "strenggenommen nicht
>>frei" einstufst; die Spezifikation ist schliesslich offengelegt [1]. Wer
>>will, darf ein Programm schreiben, das PDF darstellt oder erzeugt.

>[...]
>Soviel ich weiss, ist eine Navigation mit Bookmarks somit nur den 
>Acrobat Readers vorbehalten. Schlimmer ist jedoch die neue 
>Index-Technik von Acrobat (="Search"). Das ist eine Such-Funktion 
>über einen ganzen Ordner (oder z.B. einer CD) mit PDF-Dateien. Das 
>geht jedoch nur bei den Acrobat Readers für Windows und für neuere 
>MacOS-Systeme.

Aber müssen wir uns da nicht selber an der Nase nehmen? Es steht uns
vollkommen frei, uns hinzusetzen und diese Funktionalität selber zu
implementieren. Wir haben die Dokumentation des Formats zur Verfügung,
und wir haben bei freier Software auch das Recht, eine Suchfunktion zu
implementieren. Es wäre nicht mal so wahnsinnig viel Aufwand, z.B. xpdf
(oder auch grep) um eine entsprechende Funktion zu erweitern.

Claude Almansi <claude.almansi at bluewin.ch> schrieb:

>But the problem is that PDF are easy to make (1), so people play
>page-setters, bang the text on 3 columns with pics, and then you have to
>play jigsaw puzzle with column bits once they are converted to text or html.

[Claude: Scusa che non rispondo in inglese, ma sembra che non non hai
problemi di leggere testi tedeschi]

PDF erlaubt es eigentlich durchaus, dass Text korrekt aus mehrspaltigem
Layout extrahiert werden kann; die Datei muss dazu "nur" korrekt
aufgebaut sein. Allerdings erzeugen viele Werkzeuge katastrophal
strukturiertes PDF. Wieder ist es auch unser eigenes Problem: Aus einer
PDF-Datei, die OpenOffice erzeugt hat, konnte man mindestens vor ca.
einem Jahr den Text kaum extrahieren.


>Diese Diskussion ist auch interessant für Historiker. Wenn man in 100 
>Jahre eine CD-ROM mit PDF-Dateien lesen will, wird das nur gehen wenn 
>freie und populäre Formate überlebt haben. Die Medien-Industrie will 
>aber genau das Gegenteil, nämlich Medien, die nur der Käufer eine 
>Zeit lang anschauen kann. Kopiergeschützte, Betrachtungsgeschützte 
>(CSS) und selbstzerstörende DVDs sind ja schon Realität.

Ich bin vollkommen einverstanden.

-- Sascha

Sascha Brawer, brawer at dandelis.ch, http://www.dandelis.ch/people/brawer/ 





More information about the wilhelmtux-discussion mailing list