Codage valide des caractères Windows illégaux en HTML et XHTML

  • Profil : Expert
  • Technologie : (X)HTML
  • Auteur : Laurent Denis
  • Mise à jour : 22/05/2008

En bref

Cette page présente les caractères codés de 128 à 159 - propres à Windows, mais invalides selon les spécifications HTML 4+ et XHTML, ainsi que leurs codes de substitution valides.


Cette page présente les caractères codés de € à Ÿ - propres à Windows, mais invalides selon les spécifications HTML 4+ et XHTML .

Encodés incorrectement comme dans la première colonne de résultat du tableau ci-dessous, ces caractères ne seront pas restitués correctement sur d'autres plates-formes que Windows (Linux...), où, au mieux, un caractère générique sera affiché (fréquemment un carré vide).

Ils doivent donc être remplacés par leur équivalent en entités numériques ou entités caractères qui, elles, sont valides et seront correctement restituées.

Ces deux solutions ne sont toutefois pas équivalentes :

caractères invalides et leurs équivalents
codage invalide Entité valide Référence numérique valide résultat Remarques
€ &euro € Euro

‚ ‚ ‚ apostrophe anglaise basse
ƒ ƒ ƒ ƒ florin, forte musical
„ „ „ guillemet anglais bas
… … … points de suspension
† † † obèle, dague, croix (renvoi de notes de bas de page)
‡ ‡ ‡ double croix
ˆ ˆ ˆ ˆ accent circonflexe
‰ ‰ ‰ pour mille
Š Š Š Š S majuscule avec caron (accent circonflexe inversé) utilisé en tchèque
‹ ‹ ‹ guillemet simple allemand et suisse, parenthèse angulaire ouvrante
Œ Œ Œ Œ Ligature o-e majuscule (absente de la norme ISO-8859-1 pour une raison aberrante…)

Ž Ž Ž Z majuscule avec caron (accent circonflexe inversé) utilisé en tchèque. Présent dans le Character Encoding ISO-8859-2


‘ ‘ ‘ guillemet anglais simple ouvrant(utilisé dans les guillemets doubles)
’ ’ ’ guillemet anglais simple fermant(utilisé dans les guillemets doubles)
“ “ “ guillemets anglais doubles ouvrants
” ” ” guillemets anglais doubles fermants
• • • boulet, utiliser plutôt des listes à puces
– – – tiret demi-cadratin (incise), voir The Trouble With EM 'n EN
— — — tiret cadratin (dialogue), voir The Trouble With EM 'n EN
˜ ˜ ˜ ˜ tilde
™ ™ ™ marque déposée
š š š š s minuscule avec caron (accent circonflexe inversé) utilisé en tchèque
› › › guillemet simple allemand et suisse, parenthèse angulaire fermante
œ œ œ œ Ligature o-e minscule (absente de la norme ISO-8859-1 pour une raison aberrante…)

ž ž ž z minuscule avec caron (accent circonflexe inversé) utilisé en tchèque. Présent dans le Character Encoding ISO-8859-2
Ÿ Ÿ Ÿ Ÿ Y majuscule avec trema, présent en français dans quelques noms propres (PDF).

Une question, une remarque ? Écrivez à l'auteur.

Page valide XHTML 1 Strict, CSS2 et accessible AA.
Ce site s'affiche mieux dans un navigateur conforme aux standards, voici pourquoi.
Site hébergé par l'APINC et propulsé par SPIP.