PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : UTF-8 oder ISO-8859-1


MadMan2k
2003-10-28, 17:58:10
was ist der Unterschied zwischen den beiden Normen, außer, dass ich bei UTF-8 das Copyright-Zeichen als "& copy;" schreiben muss??

Aqualon
2003-10-28, 22:54:03
ISO-8859-1 ist ein subset von UTF-8. Mehr dazu unter http://lists.evolt.org/archive/Week-of-Mon-20020930/123855.html

Aqua

Birdman
2003-10-29, 01:01:27
UTF-8 stinkt, aber gewaltig. Wann immer im kann tu ich das sofort disablen, bzw. auf ISO-8859-1 setzten.

Meiner Erfahrung nach werde vor allem Umlaute und solche Spässe nicht korrekt dargestellt wenn mit UTF-8 gearbeitet wird.

Endorphine
2003-10-29, 09:04:05
Auf jeden Fall deutschsprachige Webseiten in ISO-8859-1 codieren. Das €-Zeichen im Text nach Möglichkeit durch "EUR" ersetzen. In kaufmännischen Rechnungen und Tabellen dann das named entity "&_euro;" (ohne Unterstrich, das Forum übernimmt es leider in den Quelltext und dann wird es natürlich interpretiert :D) verwenden, das ist die sicherste Variante, da sich der Leser dann das Symbol noch erschliessen kann, wenn der Browser mit dem entity nichts anzufangen weiß. Damit spart man sich den noch relativ wenig unterstützten Zeichensatz ISO-8859-15 ein.

Der Zeichensatz braucht man in einem HTML-Dokument aber prinzipiell nur für Offlineleser mittels Metatag explizit vorschreiben. Normalerweise gibt der Webserver die Codierung der ausgelieferten Seiten serverseitig an.

Captain America
2003-10-29, 11:21:56
Original geschrieben von Birdman
UTF-8 stinkt, aber gewaltig. Wann immer im kann tu ich das sofort disablen, bzw. auf ISO-8859-1 setzten.

Meiner Erfahrung nach werde vor allem Umlaute und solche Spässe nicht korrekt dargestellt wenn mit UTF-8 gearbeitet wird.

Hast du deinen Editor aus so eingaystellt, dass er im UTF-8 Modus läuft? :freak:

MadMan2k
2003-10-29, 16:44:53
Original geschrieben von Endorphine
Auf jeden Fall deutschsprachige Webseiten in ISO-8859-1 codieren. Das €-Zeichen im Text nach Möglichkeit durch "EUR" ersetzen. In kaufmännischen Rechnungen und Tabellen dann das named entity "&_euro;" (ohne Unterstrich, das Forum übernimmt es leider in den Quelltext und dann wird es natürlich interpretiert :D) verwenden, das ist die sicherste Variante, da sich der Leser dann das Symbol noch erschliessen kann, wenn der Browser mit dem entity nichts anzufangen weiß. Damit spart man sich den noch relativ wenig unterstützten Zeichensatz ISO-8859-15 ein.

Der Zeichensatz braucht man in einem HTML-Dokument aber prinzipiell nur für Offlineleser mittels Metatag explizit vorschreiben. Normalerweise gibt der Webserver die Codierung der ausgelieferten Seiten serverseitig an.

ok, danke!
Ich benutz es auch nur, weil W3C das vorschreibt (zumindest meckert der Validator, wenn das fehlt)

Endorphine
2003-10-30, 08:55:16
Original geschrieben von MadMan2k
ok, danke!
Ich benutz es auch nur, weil W3C das vorschreibt (zumindest meckert der Validator, wenn das fehlt) Wenn du Seiten validierst, die nicht von einem Webserver ausgeliefert wurden muss die Zeichencodierung natürlich irgendwie angegeben werden :)

Es ist IMHO einfach 'ne Optimierungsfrage. Wenn du eine Seite schreibst, die niemand offline lesen wird und dein Webserver die Codierung korrekt übermittelt kannst du dir die Angabe der Codierung in der Seite sparen. Ein paar unnötig übertragene Zeichen weniger folgern wieder in schnellerem Seitenaufbau und geringeren Traffickosten.

Wenn die Seiten auch heruntergeladen werden sollen, dann ist die Angabe der Zeichencodierung mittels <meta>-Tag praktisch ein Zwang (oder besser XHTML, dann z.B. <?xml version="1.0" encoding="ISO-8859-1"?>). Sonst muss der Browser raten, welche Zeichencodierung denn zum eigentlichen Inhalt führt.

MadMan2k
2003-10-30, 15:43:19
das Problem ist, dass ich, da ich bei Tripod bin, immer dessen Werbescripts mit reinbekomme, die natürlich nicht konform sind...
also lade ich mir immer mal eine Seite von mir runter schneid das Lycos zeugs weg und guck dann.

Die Zeichenkodierung per XML anzugeben ist auch nicht, ohne, denn dann krieg ich mit dem IE6 Fehldarstellungen.
(scheint wohl noch nicht fit dafür zu sein, denn Mozilla zeig alles korrekt an)

Birdman
2003-11-06, 18:56:28
Original geschrieben von Captain America
Hast du deinen Editor aus so eingaystellt, dass er im UTF-8 Modus läuft? :freak:
nope, wirkliche probleme gibts auch eher Serverseitig.
Z.B. mit JSP (auf einem JRUN4 Server) auf eine MySQL Database zugreiffen und Daten auf der Website anzeigen.
Diese Daten kommen verstümmelt an, sofern man nicht dem DBConnectionString ein ....ISO-8859-1 mitgibt.

Oder RedHat9 - das erste was man da deaktivieren muss nach einer Installation, ist das standardmässige verwenden von UTF-8.
Ist dies an, kann man z.B. nur noch die hälfte alles man Files lesen. Andere Textdokumente / andere Viewer haben das selbe Problem.
Es lassen sich auch einige Programme und Tools ned starten wenn das System mit UTF-8 läuft.