Unicode et Windows
En UTF-8 chaque code-point est encodé sur 1,2,3 ou 4 octets. Windows nomme ce codage code page 65001. Un seul octet pour les code-points entre U+0000 et U+007F (entre 0 et 127 en décimale) qui correspond au codage ASCII. Deux octets entre U+0080 et U+07FF. Trois octets entre U+0800 et U+D7FF ou entre U+E000 et U+FFFF. Qutre octets au delà de U+FFFF.
en UTF-16 chaque code-point est codé sur un ou deux doublets (16-bit) , l'ordre des deux doublets distinguants le codage petit boutiste ou gros boutiste. Windows dénomme code page 1200 le codage UTF-16 petit boutiste et code page 1201 le codage UTF-16 grand boutiste. Un seul doublet pour les code-points de U+0000 à U+FFFF, deux doublets pour les plans entre U+10000 et U+10FFFF
en UTF-32 chaque code-point est codé sur un seul entier 32-bit. Windows dénomme ce codage UTF-32 par code page 65005pour le petit boutiste et 65006 pour le grand boutiste.
Résumé: les code page Unicode Windows (7) sont
65000: UTF-7 (pas UNICODE stricto sensu)
65001: UTF-8
1200: UTF-16 (petit boutiste)
1201: UTF-16 (grand boutiste)
65005: UTF-32 (petit boutiste)
65006: UTF-32 (grand boutiste)
Réf :Passeport pour unicode
Desgraupes chez Vuibert