Richtiges Unfolding und falsche Charsets

Moderator: Praktikum: Internet

Geek-O
Windoof-User
Windoof-User
Beiträge: 34
Registriert: 16. Dez 2004 22:42

Richtiges Unfolding und falsche Charsets

Beitrag von Geek-O » 17. Nov 2007 18:58

(Falls dieses Posting kaputt sein sollte, ist phpBB Schuld. Die Vorschau verschluckt sich jedenfalls an irgendwas...)

Hallo,

in (vor)letzter Minute habe ich noch zwei Fragen:

1. RFC2822 sagt in Abschnitt 2.2.3, daß zum Unfolden einfach nur aus "CRLF WSP" "WSP" gemacht werden muß. In der Praxis scheinen viele Programme beim Folden von Headerzeilen auch noch eine Bißchen "hübsche Formatierung" in Form von mehr Leerzeichen einzufügen. Unfolde ich sowas nach RFC, würde z.B. aus

Code: Alles auswählen

CC: bill@example.com,
    ted@example.com,
    rufus@example.com
ein unschönes

Code: Alles auswählen

CC: bill@example.com,    ted@example.com,    rufus@example.com
Würde ich andererseits die (anscheinend) überflüssigen Leerzeichen entfernen, könnte ich aber auch erwünschte mehrfach-Leerzeichen z.B. im Subject erwischen. Sollen wir uns da im Zweifel an den RFC halten?


2. Ich weiß nicht, ob das nun ein Problem bei mir, im Java oder von Windows ist:

Code: Alles auswählen

byte() b = { (byte)0xFC };
System.out.println(new String(b, "ISO-8859-1");
gibt mir auf der Eclipse-Console ein richtiges "ü" aus, führe ich das gleiche Programm aber im "DOS"-Fenster von Windows aus, bekomme ich eine hochgestellte 3, egal welche Codepage ich einstelle. Das wundert mich insofern, als ich dachte, Java verwendet intern eh Unicode und muß sich beim Ausgeben dann halt an das aktuelle Hostsystem anpassen.

Fiele ein solches Problem noch unter "It's okay if you show such artifacts instead of the characters"?

(BTW, welche Charsets müssen wir eigentlich unterstützen? RFC2046 nennt "US-ASCII" und die ISO-8859-Familie. Nun ist mittlerweile z.B. UTF-8 sehr verbreitet, andererseits ist z.B. 8859-8 (Hebräisch) für mich etwas schwierig zu testen. Dürfen wir uns einfach auf die Zeichensätze beschränken, die Java automatisch unterstützt?)

TIA,
G.

Telis
Neuling
Neuling
Beiträge: 3
Registriert: 17. Okt 2007 14:02

Beitrag von Telis » 19. Nov 2007 12:15

Hallo,

die Folding White Spaces (FWS) sollen korrekt, d.h. standardkonform, in Whites Spaces (WSP) umgewandelt werden. Es sollen also nicht mehrfache WSP im Subject verschwinden. Eine unschöne Darstellung einiger Felder z.B. "CC" kann vermieden werden, indem für diese Felder die WSP speziell behandelt werden. Eine unschöne Darstellung (wie im vorigen Post beschrieben) ist auch akzeptabel.

Der Text sollte in der GUI mit korrekter Darstellung der Sonderzeichen angezeigt werden. Den im vorherigen Post genannten String kann man z.B. mit einem javax.swing.JLabel korrekt ausgeben.

Sie können sich auf die in Java unterstützten Charsets beschränken. D.h. sie können Charsets, die eine java.io.UnsupportedEncodingException bei der Erstellung eines String bewirken würden, ignorieren.

Grüße,

Aristotelis Hadjakos

Antworten

Zurück zu „Praktikum: Internet“