Contents

Character Encoding

Contents

Unicode

万国码/统一码,为世界上几乎所有的字符(字母、汉字、符号、甚至表情包 emoji)都分配一个唯一的数字,这个数字被称为码点。统一全球所有文字的编码方式。

在 Unicode 出现之前,每个国家都有自己的编码标准(比如中国的 GB2312,美国的 ASCII)。

utf-8