PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Encoding und Doctype


Gast
2006-02-12, 13:23:20
Ich möchte gern eine neue Seite erstellen, die möglichst W3C konform ist. Sie wird hauptsächlich auf deutsch und englisch sein. Nun stellt sich die Wahl welche Codierung und welchen Doctype ich verwende:

ISO-8859 oder Unicode, bringt mir eins Vorteile oder Nachteile, oder ist das völlig egal?
HTML oder XHTML, was bringt mir hier Vorzüge oder Nachteile? Oder dann Basic, Transitional, Strict, etc. (kein Frameset)

Wahrscheinlich ist die Wahl nicht allzu relevant für eine Seite, aber da ich mich mit den Formaten nicht so auskenne, würde ich gern wissen, ob nicht eins besser geeignet wäre als das andere

darph
2006-02-12, 14:00:31
Wenn du eh nur Englisch/Deutsch schreibst, sollte ISO völlig ausreichen.

Mit Unicode bist du halt potentiell für alle Sonderzeichen gewappnet, könntest auch auf Klingonisch schreiben usw. Dafür dürphten deine Texte aber schlimmstenfalls doppelt so groß sein. Andererseits ist das bei dem bißchen Text (ich weiß ja net, was für eine Seite du machst) dann auch nur bedingt relevant.

Insofern kannst du hier wirklich nach deinem Gutdünken walten. Ich persönlich würde Unicode nehmen, aber wie gesagt: Mehr aus persönlicher Präferenz denn aus Notwendigkeit.

Wenn du keine Frames nutzen willst und eh eine neue Seite basteln möchtest, solltest du Strict verwenden, und das Design mit CSS machen und eben nicht mit Transitional-Elementen (wie das Border Attribut, align="left" etc pp. Das macht man mit CSS).

Ob du jetzt HTML oder XHTML benutzen möchtest, ist wieder Geschmackssache. XHTML ist HTML als striktes XML, was eben bedeutet, daß du Tags immer schließen mußt. (anstatt <br> schreibst du <br />). Ist meiner Meinung nach konsequenter. Drum würde ich die XHTML empfehlen.


Außerdem ist XHTML/Unicode "in". *trendwhoresei*

PuppetMaster
2006-02-12, 15:06:51
Unicode bzw. UTF-8 bringt bei deutsch-/englischsprachingen Seiten wohl keinen Vorteil. Zudem braucht man unter Windows erstmal einen Editor, der UTF-8-Dateien ohne BOM (http://en.wikipedia.org/wiki/Byte_Order_Mark) erzeugt.


(WScite kann das anscheinend mit der Encoding-Wahl "UTF-8 Cookie". Weiß übrigens jemand, was das genau bedeutet?)

Sephiroth
2006-02-12, 16:01:52
Unicode bzw. UTF-8 bringt bei deutsch-/englischsprachingen Seiten wohl keinen Vorteil. Zudem braucht man unter Windows erstmal einen Editor, der UTF-8-Dateien ohne BOM (http://en.wikipedia.org/wiki/Byte_Order_Mark) erzeugt.
BOM sollte keine Probleme machen, wenn man nicht gerade Header Informationen mit PHP versendetn/ändern will.

(WScite kann das anscheinend mit der Encoding-Wahl "UTF-8 Cookie". Weiß übrigens jemand, was das genau bedeutet?)
Der UTF-Cookie ist ein eindeutiger Textstring, der innerhalb der beiden ersten Zeilen eines Dokumentes auftauchen kann (in einem Kommentar beispielsweise), um UTF_8-Dokumente ohne BOM zu erkennen.
Bequemerweise kann man bei Scite auch einfach code.page=65001 setzen, um immer Unicode zu nutzen.
SciTE will automatically detect the encoding scheme used for Unicode files that start with a Byte Order Mark (BOM). The UTF-8 and UCS-2 encodings are recognized including both Little Endian and Big Endian variants of UCS-2.

UTF-8 files will also be recognised when they contain a coding cookie on one of the first two lines. A coding cookie looks similar to "coding: utf-8" ("coding" followed by ':' or '=', optional whitespace, optional quote, "utf-8") and is normally contained in a comment:
# -*- coding: utf-8 -*-
For XML there is a declaration:
<?xml version='1.0' encoding='utf-8'?>

For other encodings set the code.page and character.set properties.

Ein anderer Editor wäre z.B. UniRed (http://www.esperanto.mv.ru/UniRed/ENG/index.html)


@Gast:
UTF-8 ist recht nützlich wenn du anderweitige Sonderzeichen als in ISO-8859-15 angegeben verwendest, sonst reicht ISO-8859-15 für deutsch und englisch aus.

darph
2006-02-12, 16:31:24
Notepad++ kann das BOM auch setzen und entfernen.

Scream
2007-07-31, 20:46:16
so ich habe ein problem mit meiner page:

Im W3 Validator ist alles ok.
Nur hier gibts Fehler: http://www.validome.org/ wenn ich http://scream.kumopen.de überprüfe, wenn ich aber www.antary.de überprüfe stimmt alles.


Ich habe allerdings keine Ahnung was ich falsch mache, denn es sollte eigentlich alles stimmen!

Kann mir jemand helfen?

Sephiroth
2007-07-31, 21:01:47
Weil der Server von scream.kumopen.de das Encoding überschreibt bzw. von sich aus ISO-8859-1 sendet.
hab mich vertan ...

welche zeichenkodierung verwendest du denn für die datei - iso-8859-1 wie im header angegeben oder doch utf-8?

vermutlich wird die zeichenkodierung bei scream.kumopen.de von validome ignoriert und er verwendet standardmäßig utf-8 (daher "Quelle:
Fallback"), was aber nicht passt, da es ja iso-8859-1 sein sollte. bei antary.de scheint noch ein content-encoding header gesendet zu werden, der nicht ignoriert wird.

Scream
2007-08-01, 08:13:04
welche zeichenkodierung verwendest du denn für die datei - iso-8859-1 wie im header angegeben oder doch utf-8?

ja iso-8859-1


vermutlich wird die zeichenkodierung bei scream.kumopen.de von validome ignoriert und er verwendet standardmäßig utf-8 (daher "Quelle:
Fallback"), was aber nicht passt, da es ja iso-8859-1 sein sollte. bei antary.de scheint noch ein content-encoding header gesendet zu werden, der nicht ignoriert wird.

jop sehe ich auch so
aber eigentlich sollte dann ja alles passen?

HellHorse
2007-08-01, 10:12:32
Mit Unicode bist du halt potentiell für alle Sonderzeichen gewappnet, könntest auch auf Klingonisch schreiben usw.
Nein, Klingon ist nicht in Unicode. Wurde mit einer fadenscheinigen Begründung abgelehnt. Ist zwar in Private Use Area aber das ist komplett unspezifiziert.

Dafür dürphten deine Texte aber schlimmstenfalls doppelt so groß sein.
Wenn sie bloss aus umlauten bestehen.

DanMan
2007-08-04, 16:45:55
XHTML hat zum jetzigen Zeitpunkt immernoch überhaupt keinen Vorteil Gegenüber HTML. Vor allem dann nicht, wenn du für XHTML weiterhin text/html als MIME Typ verwendest. Dann ist es für den Browser nämlich nach wie vor bloß HTML. Viel wichtiger ist es da, die Strict Variante des Doctypes zu verwenden.

Warum? Der Gag an XHTML basiertem Markup ist ja, dass du dieses in anderen XML basierten Sprachen einbetten kannst, und umgekehrt. Ein Beispiel wäre z.B. das einbetten einer SVG Grafik in ein XHTML Dokument. Wenn du sowas aber nicht vor hast, dann brauchst du auch kein XHTML.

Siehe auch: http://hixie.ch/advocacy/xhtml

P.S.: Und wer dann doch unbedingt XHTML auf text/html -Art haben will, aus welchem fadenscheinigen Grund auch immer, der soll dann doch bitte auch den Transitional Doctype nehmen.

Scream
2007-08-05, 09:57:50
ja vorerst nicht aber wer weiß was ich in zukunft noch so alles machen werde
daher ist es doch besser jetzt schon XHTML validen Code zu haben?
ich habe schließelich auch keine nachteile oder?

DanMan
2007-08-05, 13:23:24
Ja vorerst nicht, aber wer weiß was ich in Zukunft noch so alles machen werde.
Daher ist es doch besser jetzt schon XHTML validen Code zu haben, oder?
Ich habe schließlich auch keine Nachteile oder?
Nun, wenn du wirklich 100%-ig validen Code schreibst, dann könntest du das schon machen. Testen kannst du das, indem du den empfohlenen XHTML MIME-Typ einstellst, und die Seite z.B. im Firefox (nicht lokal!) öffnest.

Ohne diesen entsprechenden MIME-Typ ist es aber eben nur HTML und kein XML, wozu also? Der IE kann damit nix anfangen. Wie gesagt, ich würde HTML Strict nehmen. Das nehme ich auch auf der Arbeit mittlerweile immer, außer irgendjemand besteht aus einem nachvollziehbaren Grund auf XHTML.

Roi Danton
2007-08-09, 09:10:23
Bequemerweise kann man bei Scite auch einfach code.page=65001 setzen, um immer Unicode zu nutzen.Danke für den Tipp!