Unicode et Windows

Source Microsoft:

En UTF-8 chaque code-point est encodé sur 1,2,3 ou 4 octets. Windows nomme ce codage code page 65001. Un seul octet pour les code-points entre U+0000 et U+007F (entre 0 et 127 en décimale) qui correspond au codage ASCII. Deux octets entre U+0080 et U+07FF. Trois octets entre U+0800 et U+D7FF ou entre U+E000 et U+FFFF. Qutre octets au delà de U+FFFF.

en UTF-16 chaque code-point est codé sur un ou deux doublets (16-bit) , l'ordre des deux doublets distinguants le codage petit boutiste  ou gros boutiste. Windows dénomme code page 1200 le codage UTF-16 petit boutiste et code page 1201 le codage UTF-16 grand boutiste. Un seul doublet pour les code-points de U+0000 à U+FFFF, deux doublets pour les plans entre  U+10000 et U+10FFFF       

en UTF-32 chaque code-point est codé sur un seul entier 32-bit. Windows dénomme ce codage UTF-32 par code page 65005pour le petit boutiste et 65006 pour le grand boutiste.

 

Résumé: les code page Unicode Windows (7) sont

65000: UTF-7 (pas UNICODE stricto sensu)

65001: UTF-8

1200:   UTF-16  (petit boutiste)

1201:   UTF-16  (grand boutiste)

65005: UTF-32 (petit boutiste)

65006: UTF-32 (grand boutiste)

Réf :Passeport pour unicode

 Desgraupes chez Vuibert