UTF-16是
Unicode的其中一个使用方式。
UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。
它定义于
ISO/IEC 10646-1的附录Q,而
RFC2781也定义了
相似的做法。
在Unicode基本多文种平面定义的
字符(无论是
拉丁字母、
汉字或其他
文字或
符号),一律使用2字节储存。而在辅助平面定义的字符,会以代理对(surrogate pair)的形式,以两个2字节的值来储存。
UTF-16比起
UTF-8,好处在于大部分字符都以固定长度的字节 (2字节) 储存,但UTF-16却无法兼容于
ASCII编码。