French/Unicode
L'Unicode est un jeu de caractères bien plus étendu que l'ASCII puisque le nombre de bits possibles pour représenter un caractère passe de 7 bits à 32 bits. Cela permet d'inclure des alphabets arabes, des jeux de caractères pour des langues asiatiques, des caractères mathématiques, etc. En réalité l'ambition est de pouvoir représenter par un code unique tous les caractères. L'allocation des codes de caractères est un travail perpétuellement en évolution maintenu par le consortium Unicode.
Les caractères les plus fréquents sont codés avec des nombres inférieurs à 216 = 65536 ; les premières 256 valeurs sont identiques au jeu Latin-1. Du texte utilisant le jeu de caractères Unicode est en général stocké ou transmis selon un encodage particulier (UTF-8 ou UTF-16), qui permettent de représenter tous les caractères Unicode tout en économisant en taille lorsque la plupart des caractères sont des caractères ASCII.