French/UTF-8

From DPWiki

L'UTF-8 est un mode d'encodage des caractères Unicode sous la forme de suites d'octets (nombres allant de 0 à 255 inclus), tout en conservant l'encodage d'origine des caractères en pur ASCII.

Les valeurs d'octet de 0 à 127 inclus représentent les caractères ASCII usuels; les valeurs de 128 à 191 inclus sont utilisées pour représenter un bloc de 6 bits; et les valeurs au-dessus de 192 sont utilisées comme préfixe indiquant le nombre de blocs de 6 bits suivant, pour représenter des nombres sur 12, 18, 24, ... bits.

Il se trouve que les caractères Latin-1 de valeur comprise entre 128 et 191 inclus sont encodés avec l'octet de valeur 192 suivi du caractère lui-même; les caractères Latin-1 de 192 à 255 sont codés par l'octet 193 suivi du code de caractère moins 64.