2014年1月19日 星期日

常見編碼種類

Big5:這是繁體中文 de facto 標準。
CNS11643:台灣的官方標準繁體中文編碼。
Cp937:繁體中文加上 6204 個使用者自定的字元。
Cp948:繁體中文版 IBM OS/2 用的編碼方式。
Cp964:繁體中文版 IBM AIX 用的編碼方式。
EUC_TW:台灣的加強版 Unicode。
ISO2022CN:編碼中文的一套標準。
ISO2022CN_CNS:編碼中文的一套標準,繁體版,襲自 CNS11643。
MS950 或 Cp950:ASCII + Big5,用於台灣和香港的繁體中文 MS Windows作業系統。(以後編碼用這各,才比較沒問題)
Unicode: 有次序記號的 Unicode。次序記號佔用兩個 byte,如果其值是0xFEFF,表示使用 big-endian(由大到小)的次序為 Unicode 編碼;如果其值是 0xFFFF,表示使用 little-endian(由小到大)的次序為 Unicode 編碼。
UnicodeBig:使用 big-endian(由大到小)的次序為 Unicode 編碼。
UnicodeLittle:使用 little-endian(由小到大)的次序為 Unicode 編碼。
UTF8:使用 UTF-8 為 Unicode 編碼。
UTF16:使用 UTF-16 為 Unicode 編碼。